科技

【AI工具】Google I/O前夕大動作!最強影片AI「Gemini Omni」將問世?

記者鄧天心/綜合報導

Google似乎正在為Gemini系列加入新成員,近期部分測試頁面被人發現,一款「Gemini Omni」的新型影片生成模型已現身。

google(圖/123RF)
Google I/O前夕大驚喜,Gemini Omni影音模型悄悄亮相。(圖/123RF)

根據使用者介面,Google將Gemini Omni定位為多樣化功能的模型,支援「重新混製(Remix)」現有影片,還能在對話框中直接編輯或套用模板。雖然目前尚不確定Omni與Google既有的Veo模型確切的分工邏輯,但從後設數據推測,Omni極有可能是Veo的延伸進階版本。

在初步的Demo展示中,兩組測試案例體現了該模型的實力,當輸入「教授在傳統黑板寫下三角函數恆等式的數學證明,並解釋當前步驟」時,即便仔細觀察仍能發現些許AI生成的痕跡,但影片在處理動態文字書寫的精準度與擬真度上表現優異。

更多科技工作請上科技專區:https://techplus.1111.com.tw/
科技社群討論區:https://pei.com.tw/feed/c/tech-plus

針對過去AI界知名的「威爾史密斯吃麵」測試,Omni成功生成兩位男士在海邊餐廳優雅用餐的畫面。相較於早期AI生成的混亂影像,這次的產出在動作穩定性與環境細節上皆有進步。

高品質的影片生成仍相當耗費運算資源,在AI Pro方案的測試紀錄中,僅生成兩段上述影片便佔用了當日86%的使用額度,也印證了先前市場傳出Google計畫針對高效能模型有更明確使用限制的傳聞。

儘管Google官方尚未正式發表Gemini Omni,但考量到今年稍早OpenAI停止Sora開發後Google曾宣示深耕影片技術的決心,在即將到來的I/O 2026大會上,可能將會有更多關於Gemini與影片生成佈局的具體消息。

延伸閱讀:

【AI工具】Claude跟Codex哪個比較聰明?請他們開發一個APP後 找到了答案

參考資料:

An impressive new Gemini ‘Omni’ video model just leaked ahead of Google I/O

Gemini ‘Omni’ video model shows up with some early demos

Loading

本篇文章授權來源:科技島

Author

Write A Comment