【財新網(wǎng)】“如果類比語言模型,目前的視頻生成有點像GPT-3左右的時代,距離到GPT-3.5版本的爆發(fā)點可能還有半年左右的時間,但應該不遠了。”7月5日,新加坡南洋理工大學助理教授劉子緯在2024世界人工智能大會的視頻生成前沿技術論壇上表示。
劉子緯主要研究計算機視覺、計算機圖形學等,領導搭建了數(shù)個國際知名的基準數(shù)據(jù)庫,例如CelebA和DeepFashion等。
2022年11月,OpenAI推出基于GPT-3.5模型的聊天應用ChatGPT,掀起全球新一波AI浪潮。2024年2月,OpenAI展示了名為Sora的文生視頻模型,讓視頻生成領域迅速爆火。不過,半年過去,Sora依舊沒有對外開放使用,其展示的視頻被藝術團隊披露包含大量人類后期特效,也讓其惹上夸大宣傳的爭議。