科技

不再一顆打天下!Google拆分訓練與推論晶片 正面對決輝達

記者黃仁杰/編譯

Google再度加碼AI晶片戰局,宣布將其Tensor Processing Unit(TPU)架構進一步拆分為「訓練」與「推論」兩種專用處理器,成為最新一波對抗輝達的關鍵布局。新一代第八代TPU預計將於今(2026)年內正式推出。

Google再度加碼AI晶片戰局,宣布將其Tensor Processing Unit(TPU)架構進一步拆分為「訓練」與「推論」兩種專用處理器。(圖/123RF)

Google指出,隨著AI從模型訓練邁向大規模應用,尤其是代理型AI(Agentic AI)興起,市場對不同運算場景的需求差異愈來愈明顯,因此決定將訓練與推論任務分開優化。Google資深副總裁暨AI與基礎設施首席技術長阿敏・瓦赫達特(Amin Vahdat)表示,此舉有助於提升效率,讓AI系統在實際部署時更具成本效益。

在性能方面,Google指出,新的訓練晶片在相同價格下,效能較上一代Ironwood TPU提升2.8倍;推論晶片則提升約80%。其中,推論專用晶片TPU 8i採用大量SRAM設計,每顆晶片搭載384MB SRAM,是前一代的三倍,主打高吞吐量與低延遲,以支援數百萬個AI代理同時運作。

這樣的發展也呼應產業趨勢。包括蘋果、微軟與Meta等科技巨頭,近年皆積極投入自研AI晶片,以提升運算效率並降低對外部供應商依賴。Google早在2015年即開始導入自研AI晶片,並於2018年開放雲端租用,布局已久。

儘管如此,輝達仍穩居市場龍頭地位,Google此次並未直接比較性能。不過隨著企業對算力需求持續擴大,TPU正逐漸成為雲端市場的重要替代方案。

Google透露,目前包括Citadel Securities與美國能源部旗下17座國家實驗室,皆已採用其TPU進行AI運算;此外,Anthropic也承諾採用多GW規模的TPU算力。

Alphabet執行長皮查伊(Sundar Pichai)則表示,新一代架構的目標是在成本可控前提下,支撐大規模AI代理同時運作。整體來看,Google正透過「專用化晶片+雲端整合」策略,加速在AI基礎設施市場與輝達正面競爭。

來源:CNBC

Loading

本篇文章授權來源:科技島

Author

Write A Comment