剛剛看到一則有趣的新聞,關於由 Anuttacon 推出的角色展示 AI 發展,這是一家由 miHoYo 創始人蔡昊宇成立的 AI 公司。



他們剛剛推出了 LPM 1.0,一個相當令人驚訝的角色視頻展示模型。這個系統讓角色能夠同步說話、唱歌、聽音樂並表現出所有反應,且是即時的。更棒的是,嘴型、表情以及身體動作都非常逼真,完全不像是人工合成的。

從技術角度來看,他們使用了擁有 170 億參數的基礎模型,並調整成低延遲的串流版本。值得一提的是,它支持多種角色風格,從真實風格、2D 動畫到 3D 遊戲,甚至非人類生物,都不需要額外調整。

我注意到的是,Anuttacon 已經推出了 LPM-Bench 評估標準,這使得它在多個指標上都比市場上的其他模型表現更佳。主要差異在於,LPM 1.0 可以無限制地輸出內容,而其他選項則限制在 30 秒內。

他們感興趣的應用場景非常明確,包括 NPC 角色的對話以及虛擬直播,這些都是具有巨大潛力的應用,尤其適合 miHoYo 和其他遊戲公司。

不過,需要注意的是,Anuttacon 明確表示這次發布僅供學術交流,暫時沒有開源或提供 API 給公眾的計劃。大多數社群認為,主要目的是吸引具有 AI 才能的人才。

回顧來看,LPM 1.0 是 Anuttacon 在遊戲引擎和智能 NPC 方面 AI 發展的下一步,也是 miHoYo AI 發展的一個成果,從 AnuNeko 聊天工具到基礎模型的能力,蔡昊宇和他的團隊似乎正打造一些在 AI 角色領域具有重要意義的東西。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆