【財(cái)新網(wǎng)】全球大模型仍在競速跑。當(dāng)?shù)貢r間7月9日晚,馬斯克旗下AI公司xAI發(fā)布最新一代大模型Grok 4和Grok 4 Heavy,其中Grok 4為單智能體版,消費(fèi)者可花30美元/月訂閱體驗(yàn);Grok 4 Heavy為多智能體版,訂閱費(fèi)用高達(dá)300美元/月。
馬斯克以“人類最后的測試”(Humanity’s Last Exam)為標(biāo)準(zhǔn),發(fā)現(xiàn)在不使用工具的情況下,Grok 4的分值為25.4%,高于谷歌最先進(jìn)的Gemini 2.5 Pro(21.6%),也高于OpenAI的o3大模型(21%)。如果讓大模型調(diào)用工具,Grok 4的分值達(dá)34.6%,Grok 4 Heavy的分值達(dá)44.4%。“人類最后的測試”難度很高,包括了2500個極其困難的學(xué)術(shù)問題,涉及一百多個學(xué)科。