1.5 小時內的八大重磅公告:NVIDIA 的 Vera Rubin 預示 AI 推理的新時代

在2026年1月5日於拉斯維加斯舉行的CES展覽中,NVIDIA執行長黃仁勳發表了一場具有里程碑意義的主題演說,將八項重要公告濃縮在僅僅1.5小時內,標誌著產業焦點從AI模型訓練轉向大規模、成本效益高的推理。此次展示揭示了一個涵蓋定制矽晶片、系統設計、開源軟體與機器人應用的完整架構,集體將NVIDIA定位為下一階段AI基礎建設演進的主導者。

所有1.5小時的公告貫穿的核心敘事反映了一個根本轉變:隨著AI模型每年擴展10倍,推理的Token量每年增加5倍,AI的經濟性正由效率與規模重塑,而非純粹的計算能力。NVIDIA的回應是Vera Rubin——一個圍繞六款專有晶片,前所未有協調運作的AI超級電腦的全新構想。

Vera Rubin:六款共同設計晶片實現3.6 EFLOPS單櫃性能

旗艦Vera Rubin平台代表一種工程哲學,即每個元件——CPU、GPU、網路、存儲與互連——皆為共同開發,旨在消除系統邊界的低效率。Vera Rubin NVL72將2兆個晶體管整合於模組化機櫃中,提供3.6 EFLOPS(exaFLOPS)的推理性能,較前一代Blackwell提升五倍。

此架構由六個由NVIDIA開發的元件協同運作:

**Vera CPU:**以88個定制的Olympus核心為核心,並配備1.8TB/s NVLink-C2C頻寬,用於統一CPU-GPU記憶體。系統記憶體達到1.5TB,是上一代Grace CPU的三倍,支援複雜的資料調度,適用於代理工作負載與串流應用。

**Rubin GPU:**核心性能亮點,搭載Transformer引擎,推理能力達50 PFLOPS(5倍Blackwell),訓練性能為35 PFLOPS(3.5倍Blackwell)。支援HBM4記憶體,提供22TB/s帶寬,是前一代的2.8倍,對於記憶體密集型的MoE(專家混合)模型架構尤為重要。

**NVLink 6 Switch:**每GPU帶寬達3.6TB/s(前一代的兩倍),在網路內計算提供14.4 TFLOPS的FP8精度。交換機結構支持全液冷,對於高功率密度至關重要。

**ConnectX-9 SuperNIC與BlueField-4 DPU:**共同提供智慧型網路卸載,BlueField-4的運算性能是前代的6倍,同時降低GPU在存儲與網路任務上的負擔。

在系統層面,Vera Rubin NVL72擁有54TB LPDDR5X記憶體(前一代的2.5倍)與20.7TB HBM4(1.5倍),總垂直擴展帶寬高達260TB/s,超越全球網際網路的整體吞吐量。組裝時間從兩小時縮短至約五分鐘,且由於模組化、無主機、無纜線架構與第二代RAS引擎,維護可在不中斷系統運作的情況下進行。

三大突破轉變推理經濟

與Vera Rubin同時推出的,還有三款補充產品,旨在解決大規模AI推理中的持續瓶頸:

**Spectrum-X以太網封裝光學模組:**採用雙晶片設計與200Gbps SerDes技術,提供512端口高密度或128端口緊湊配置。CPO交換在能效提升5倍、可靠性提高10倍、應用正常運作時間延長5倍方面皆有顯著進步,直接降低資料中心的總擁有成本。

**推理上下文記憶體存儲平台:**這個改變遊戲規則的記憶體層級,解決了隨著代理AI系統中上下文窗口擴展至數百萬Token,存取與重用Key-Value(KV)快取的高昂計算成本問題。透過將上下文視為一等資料類型,協調存儲、網路與計算資源,該平台在推理性能提升5倍的同時,也降低能源消耗同樣的比例。此層介於GPU記憶體與傳統存儲之間,並與BlueField-4與Spectrum-X緊密整合,最大限度減少資料移動開銷。

**DGX SuperPOD(基於Vera Rubin):**作為企業級AI部署的即用型藍圖,SuperPOD利用NVLink 6協調八個Vera Rubin NVL72系統進行垂直擴展,並用Spectrum-X以太網進行水平擴展。結果是:與Blackwell系統相比,訓練同等規模的MoE模型所需GPU數量僅為四分之一,而大型MoE工作負載的推理Token成本則降低至前一代的十分之一。

從650個開源模型到代理AI藍圖:NVIDIA的軟體攻勢

雖然硬體優化吸引目光,但NVIDIA的軟體策略同樣雄心勃勃。僅2025年,NVIDIA就在Hugging Face上成為最大貢獻者,釋出650個開源模型與250個資料集。令人驚訝的是,開源模型如今約佔所有平台(如OpenRouter)所用Token的四分之一,較去年成長20倍。

除了模型數量的激增,NVIDIA還推出了“Blueprints”——模版化的AI系統架構,讓開發者能快速部署多模型、混合雲的代理系統。這些框架整合於NVIDIA的SaaS平台,能根據用戶意圖動態將任務路由至本地私有模型或雲端前沿模型,同時無縫調用外部工具(API、機器人介面、行事曆服務),並融合多模態輸入(文字、語音、圖像與感測器資料)做出統一決策。

NVIDIA的Nemotron家族也擴展,包括代理RAG模型、安全性為重的變體與語音識別能力,並推出全新開源的機器人模型。這個生態系統策略——結合寬鬆授權與產業級工具——加速採用,同時確保開發者在部署與優化上依賴NVIDIA平台。

Alpha-Mayo:推理自主性進入量產階段

或許最具體的1.5小時公告,是Alpha-Mayo的推出——NVIDIA首款真正開源的模型,使自駕車能“思考”複雜、未見場景。擁有10億參數,Alpha-Mayo體積輕巧,適用於自主車輛研究平台,又足夠複雜,能進行現實世界的推理。

此模型作為一個基於推理的任務-行動系統:不再是直接感知到控制的映射,而是將駕駛決策拆解為深思熟慮的步驟,考慮多種可能性,並選擇最安全的軌跡。這對於交通燈失效、繁忙交叉口的不可預測行人行為等邊緣案例尤為重要,傳統端到端網路難以安全應對。

由Alpha-Mayo驅動的NVIDIA DRIVE已進入量產,並已搭載於新款梅賽德斯-賓士CLA,該車近期獲得NCAP最高安全評級。系統目前支持免持駕駛高速公路,計畫於2026年晚些時候推出城市自主駕駛。此外,NVIDIA宣布與多家領先機器人公司合作——包括Boston Dynamics、Franka Robotics、Surgical、LG Electronics、NEURA、XRLabs與Logic Robotics——共同標準化NVIDIA Isaac與GR00T框架。同時,與西門子合作,將NVIDIA CUDA-X、AI模型與Omniverse模擬能力整合進西門子的CAE、EDA與數位雙生平台,擴展實體AI在設計、模擬、製造與運營領域的應用。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
  • 熱門 Gate Fun

    查看更多
  • 市值:$0.1持有人數:1
    0.00%
  • 市值:$2472.41持有人數:1
    0.00%
  • 市值:$0.1持有人數:2
    0.00%
  • 市值:$2491.38持有人數:2
    0.00%
  • 市值:$2455.17持有人數:1
    0.00%