記者彭夢竺/編譯
輝達(NVIDIA)不僅在AI硬體市場叱吒風雲,軟體實力也再度獲得證明,他們最新發布的開源AI模型「Nemotron 3 Super」在EnterpriseOps-Gym排行榜中奪冠,展現出強大的企業級應用與推論能力,正式超越DeepSeek與Kimi等競爭對手。

1200億參數推力 Nemotron 3 Super五大技術創新
輝達於今年3月推出的Nemotron 3 Super是一款擁有1,200億(120B)總參數、其中120億(12B)為活躍參數的AI模型,採用混合專家(MoE)架構,推論速度較前代提升5倍,並具備原生100萬(1M)Token的超長上下文窗口。
- 潛在專家混合(Latent MoE):在Token到達專家層前先進行壓縮,讓相同推論成本下能調用4倍數量的專家。
- 多Token預測(MTP): 一次前向傳播可預測多個未來Token,大幅縮短長序列生成時間。
- 混合Mamba-Transformer架構:結合Mamba的序列效率與Transformer的精準推理,使記憶體與運算效率提升4倍。
- 原生NVFP4預訓練:專為Blackwell架構優化,在B200晶片上的推論速度比H100(FP8)快4倍。
- 多環境強化學習(RL):透過超過120萬次環境演練,提升模型在21種環境配置下的適應力。
更多科技工作請上科技專區:https://techplus.1111.com.tw/
科技社群討論區:https://pei.com.tw/feed/c/tech-plus
橫掃企業級測試 擊敗DeepSeek與GPT-OSS奪冠
根據EnterpriseOps-Gym公布的最新基準測試數據,該測試評估AI代理在具備512種功能工具的互動環境中,執行1,150項任務的表現,Nemotron 3 Super以27.3分的平均成績奪下開源模型排行榜首位,特別在團隊協作(TEAMS)、電子郵件與混合工作流中表現優異。
在此次排名中,輝達成功擊敗了位居第二的Kimi-K2.5以及第三名的DeepSeek v3.2,而GPT-OSS-120B則位列第五。這證明了輝達的AI模型在協調多個企業系統與工具以完成單一工作流方面,具有領先業界的實力。
從Nano到Ultra 輝達建立全方位AI軟硬體生態系
輝達的Nemotron 3系列包含Nano、Super與Ultra等不同規模的模型,近期更推出Nemotron 3 Nano Omni,將代理式AI(Agentic AI)的推論速度提升9倍。
隨著Nemotron 3 Super的強勢登頂,輝達再次證明自己不僅是全球領先的晶片供應商,更是具備完整AI技術棧(Full-stack)的軟體巨頭。對於企業而言,選擇輝達的全方位解決方案,將能同時獲得最頂尖的硬體效能與軟體智慧,成為AI轉型競賽中的首選。
資料來源:wccftech
—
本篇文章授權來源:科技島