Nemotron 3:AI 基礎設施的戰略轉折

Nvidia 於 2025 年 12 月 15 日正式發布開源模型家族,定義推理能力的新標準。

聆聽本集Podcast

1. 宏觀背景與事件綜述

戰略性反攻

在 OpenAI、Google 與 AWS 自研晶片的夾擊下,Nvidia 透過 Nemotron 3 執行「商品化互補品」戰略。當模型開源且免費時,企業將更關注運行效率,而深度綁定 Nvidia 硬體的 Nemotron 3 確保了 GPU 的絕對領先地位。

全棧開源策略

  • 模型層: 混合 Mamba-Transformer 架構
  • 數據層: 開源高質量訓練數據集
  • 工具層: 發布 NeMo Gym 強化學習環境

2. 技術深潛:混合架構革命

混合 Mamba 架構

結合 Transformer 的邏輯推理與 Mamba 的線性擴展性,完美支持 1M+ token 長文本,且推理延遲極低。

NVFP4 物理綁定

原生支持 4-bit 浮點格式,僅在 Blackwell 架構上可實現 4 倍吞吐量提升,築起強大硬體護城河。

Latent MoE 技術

新型專家路由機制,Ultra 版本雖有 500B 參數,每次僅激活 50B,效率與精度兼得。

3. 產品矩陣與互動查詢

模型名稱 總參數 / 激活參數 核心定位 推薦場景
Nemotron 3 Nano 30B / 3B Active 邊緣計算、極低延遲 代碼輔助、多智能體路由、手機端推理
Nemotron 3 Super 100B / 10B Active 企業 IT 自動化 票務處理、文檔自動化、RAG 檢索
Nemotron 3 Ultra 500B / 50B Active 旗艦級企業推理引擎 深度科研、複雜邏輯推理、多模態分析

4. 巔峰對決:效能指標分析

核心基準測試得分 (AIME & SWE-bench)

競爭差異化總覽

對標 GPT-5.2: GPT-5.2 強於「深度思考」邏輯,但 Nemotron 3 在性價比推理速度上取得領先,更適合高頻企業應用。

對標 Gemini 3: Gemini 3 強於 Workspace 生態整合,Nemotron 3 則主打私有化部署主權數據安全

上下文優勢: 混合架構提供原生 1M+ 上下文支持,推理成本顯著低於純 Transformer 模型。

5. 投資策略與財報展望

Q4 FY26 預計營收

$650 億美元

Blackwell 訂單積壓

$5,000 億

目前動態 P/E

30-40x

一般投資者策略

長期持有

對於投資者而言,眼前的股價回調並非趨勢的終結,而是新一輪增長周期的起點。Nvidia 正在從一家週期性的硬體製造商,蛻變為一家擁有極高用戶黏性的 AI 平台與公用事業公司。

長期目標價:$250