【財(cái)新網(wǎng)】年初DeepSeek模型出圈讓大模型創(chuàng)業(yè)公司重回技術(shù)競(jìng)賽。7月11日晚間,大模型創(chuàng)業(yè)公司月之暗面發(fā)布了首個(gè)開源的基座大模型Kimi K2,對(duì)標(biāo)DeepSeek-V3、OpenAI的GPT-4.1等模型。截至發(fā)稿時(shí),該模型已經(jīng)是全球最大的AI開源社區(qū)HuggingFace熱度第一的模型,發(fā)布三天就已經(jīng)獲得1.93萬次下載,為近期熱度最高的開源基座模型。
該模型也在海外技術(shù)圈內(nèi)引發(fā)了討論,例如大模型訓(xùn)練、推理服務(wù)商Together AI的首席科學(xué)家Tri Dao就在社交媒體上稱其試用該模型的體驗(yàn)已經(jīng)與業(yè)內(nèi)最前沿的模型相當(dāng)。多模態(tài)模型公司Stability AI的創(chuàng)始人Emad Mostaque也發(fā)文指出,Kimi K2訓(xùn)練所需的算力已經(jīng)與DeepSeek相當(dāng),這證明了模型能力并不只能通過增加算力提升。