科技

推論晶片掀價格戰!Groq成本僅輝達2成、速度翻倍

記者黃仁杰/編譯

隨著AI算力需求持續爆發,市場競爭焦點正從效能轉向成本。雲端基礎設施業者Nebius專家指出,雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。

雖然輝達GPU仍在效能上領先,但替代方案正快速崛起,其中Groq在推論晶片領域展現明顯成本與速度優勢。(圖/輝達提供)

該專家指出,目前AI基礎設施的計價方式正出現重大轉變,從過去以「每小時GPU成本」為主,逐漸轉向「每百萬Token成本」。在現行市場中,輝達H100每小時約2.95美元,H200約3.5美元,最新Blackwell B200則落在4.9至6.5美元之間;若採長期預訂模式,價格可降至1.5至3.5美元不等。

然而在新的Token計價模式下,差距更加明顯。Groq晶片每百萬Token成本僅約0.05至0.10美元,而輝達Blackwell系列(B100、B200、B300)則約0.25美元,成本高出約5倍。

更多科技工作請上科技專區:https://techplus.1111.com.tw/

科技社群討論區:https://pei.com.tw/feed/c/tech-plus

除了價格優勢外,Groq在推論速度上也具競爭力。Nebius專家指出,其晶片最高可達每秒800個Token輸出,幾乎是輝達約450 Token/秒的兩倍,顯示在即時推論場景中更具效率。

專家進一步分析,目前企業AI工作負載中,有高達90%至95%集中在推論,而非模型訓練。隨著企業多採用現成模型與API服務,推論需求快速放大,也帶動對專用推論晶片的需求。

此外,輝達也早在2025年底與Groq簽署非獨家授權合作,顯示其對推論市場的重視。不過在成本導向逐漸成為主流的情況下,市場對替代晶片的接受度正快速提升。

來源:wccftech

Loading

本篇文章授權來源:科技島

Author

Write A Comment