記者鄧天心/綜合報導
Google似乎正在為Gemini系列加入新成員,近期部分測試頁面被人發現,一款「Gemini Omni」的新型影片生成模型已現身。

根據使用者介面,Google將Gemini Omni定位為多樣化功能的模型,支援「重新混製(Remix)」現有影片,還能在對話框中直接編輯或套用模板。雖然目前尚不確定Omni與Google既有的Veo模型確切的分工邏輯,但從後設數據推測,Omni極有可能是Veo的延伸進階版本。
在初步的Demo展示中,兩組測試案例體現了該模型的實力,當輸入「教授在傳統黑板寫下三角函數恆等式的數學證明,並解釋當前步驟」時,即便仔細觀察仍能發現些許AI生成的痕跡,但影片在處理動態文字書寫的精準度與擬真度上表現優異。
更多科技工作請上科技專區:https://techplus.1111.com.tw/
科技社群討論區:https://pei.com.tw/feed/c/tech-plus
針對過去AI界知名的「威爾史密斯吃麵」測試,Omni成功生成兩位男士在海邊餐廳優雅用餐的畫面。相較於早期AI生成的混亂影像,這次的產出在動作穩定性與環境細節上皆有進步。
高品質的影片生成仍相當耗費運算資源,在AI Pro方案的測試紀錄中,僅生成兩段上述影片便佔用了當日86%的使用額度,也印證了先前市場傳出Google計畫針對高效能模型有更明確使用限制的傳聞。
儘管Google官方尚未正式發表Gemini Omni,但考量到今年稍早OpenAI停止Sora開發後Google曾宣示深耕影片技術的決心,在即將到來的I/O 2026大會上,可能將會有更多關於Gemini與影片生成佈局的具體消息。
延伸閱讀:
【AI工具】Claude跟Codex哪個比較聰明?請他們開發一個APP後 找到了答案
參考資料:
An impressive new Gemini ‘Omni’ video model just leaked ahead of Google I/O
Gemini ‘Omni’ video model shows up with some early demos
—
本篇文章授權來源:科技島