1.5 小時內的八大重磅公告：NVIDIA 的 Vera Rubin 預示 AI 推理的新時代

2026-01-28 13:15:42

在2026年1月5日於拉斯維加斯舉行的CES展覽中，NVIDIA執行長黃仁勳發表了一場具有里程碑意義的主題演說，將八項重要公告濃縮在僅僅1.5小時內，標誌著產業焦點從AI模型訓練轉向大規模、成本效益高的推理。此次展示揭示了一個涵蓋定制矽晶片、系統設計、開源軟體與機器人應用的完整架構，集體將NVIDIA定位為下一階段AI基礎建設演進的主導者。

所有1.5小時的公告貫穿的核心敘事反映了一個根本轉變：隨著AI模型每年擴展10倍，推理的Token量每年增加5倍，AI的經濟性正由效率與規模重塑，而非純粹的計算能力。NVIDIA的回應是Vera Rubin——一個圍繞六款專有晶片，前所未有協調運作的AI超級電腦的全新構想。

Vera Rubin：六款共同設計晶片實現3.6 EFLOPS單櫃性能

旗艦Vera Rubin平台代表一種工程哲學，即每個元件——CPU、GPU、網路、存儲與互連——皆為共同開發，旨在消除系統邊界的低效率。Vera Rubin NVL72將2兆個晶體管整合於模組化機櫃中，提供3.6 EFLOPS（exaFLOPS）的推理性能，較前一代Blackwell提升五倍。

此架構由六個由NVIDIA開發的元件協同運作：

**Vera CPU：**以88個定制的Olympus核心為核心，並配備1.8TB/s NVLink-C2C頻寬，用於統一CPU-GPU記憶體。系統記憶體達到1.5TB，是上一代Grace CPU的三倍，支援複雜的資料調度，適用於代理工作負載與串流應用。

**Rubin GPU：**核心性能亮點，搭載Transformer引擎，推理能力達50 PFLOPS（5倍Blackwell），訓練性能為35 PFLOPS（3.5倍Blackwell）。支援HBM4記憶體，提供22TB/s帶寬，是前一代的2.8倍，對於記憶體密集型的MoE（專家混合）模型架構尤為重要。

**NVLink 6 Switch：**每GPU帶寬達3.6TB/s（前一代的兩倍），在網路內計算提供14.4 TFLOPS的FP8精度。交換機結構支持全液冷，對於高功率密度至關重要。

**ConnectX-9 SuperNIC與BlueField-4 DPU：**共同提供智慧型網路卸載，BlueField-4的運算性能是前代的6倍，同時降低GPU在存儲與網路任務上的負擔。

在系統層面，Vera Rubin NVL72擁有54TB LPDDR5X記憶體（前一代的2.5倍）與20.7TB HBM4（1.5倍），總垂直擴展帶寬高達260TB/s，超越全球網際網路的整體吞吐量。組裝時間從兩小時縮短至約五分鐘，且由於模組化、無主機、無纜線架構與第二代RAS引擎，維護可在不中斷系統運作的情況下進行。

三大突破轉變推理經濟

與Vera Rubin同時推出的，還有三款補充產品，旨在解決大規模AI推理中的持續瓶頸：

**Spectrum-X以太網封裝光學模組：**採用雙晶片設計與200Gbps SerDes技術，提供512端口高密度或128端口緊湊配置。CPO交換在能效提升5倍、可靠性提高10倍、應用正常運作時間延長5倍方面皆有顯著進步，直接降低資料中心的總擁有成本。

**推理上下文記憶體存儲平台：**這個改變遊戲規則的記憶體層級，解決了隨著代理AI系統中上下文窗口擴展至數百萬Token，存取與重用Key-Value（KV）快取的高昂計算成本問題。透過將上下文視為一等資料類型，協調存儲、網路與計算資源，該平台在推理性能提升5倍的同時，也降低能源消耗同樣的比例。此層介於GPU記憶體與傳統存儲之間，並與BlueField-4與Spectrum-X緊密整合，最大限度減少資料移動開銷。

**DGX SuperPOD（基於Vera Rubin）：**作為企業級AI部署的即用型藍圖，SuperPOD利用NVLink 6協調八個Vera Rubin NVL72系統進行垂直擴展，並用Spectrum-X以太網進行水平擴展。結果是：與Blackwell系統相比，訓練同等規模的MoE模型所需GPU數量僅為四分之一，而大型MoE工作負載的推理Token成本則降低至前一代的十分之一。

從650個開源模型到代理AI藍圖：NVIDIA的軟體攻勢

雖然硬體優化吸引目光，但NVIDIA的軟體策略同樣雄心勃勃。僅2025年，NVIDIA就在Hugging Face上成為最大貢獻者，釋出650個開源模型與250個資料集。令人驚訝的是，開源模型如今約佔所有平台（如OpenRouter）所用Token的四分之一，較去年成長20倍。

除了模型數量的激增，NVIDIA還推出了“Blueprints”——模版化的AI系統架構，讓開發者能快速部署多模型、混合雲的代理系統。這些框架整合於NVIDIA的SaaS平台，能根據用戶意圖動態將任務路由至本地私有模型或雲端前沿模型，同時無縫調用外部工具（API、機器人介面、行事曆服務），並融合多模態輸入（文字、語音、圖像與感測器資料）做出統一決策。

NVIDIA的Nemotron家族也擴展，包括代理RAG模型、安全性為重的變體與語音識別能力，並推出全新開源的機器人模型。這個生態系統策略——結合寬鬆授權與產業級工具——加速採用，同時確保開發者在部署與優化上依賴NVIDIA平台。

Alpha-Mayo：推理自主性進入量產階段

或許最具體的1.5小時公告，是Alpha-Mayo的推出——NVIDIA首款真正開源的模型，使自駕車能“思考”複雜、未見場景。擁有10億參數，Alpha-Mayo體積輕巧，適用於自主車輛研究平台，又足夠複雜，能進行現實世界的推理。

此模型作為一個基於推理的任務-行動系統：不再是直接感知到控制的映射，而是將駕駛決策拆解為深思熟慮的步驟，考慮多種可能性，並選擇最安全的軌跡。這對於交通燈失效、繁忙交叉口的不可預測行人行為等邊緣案例尤為重要，傳統端到端網路難以安全應對。

由Alpha-Mayo驅動的NVIDIA DRIVE已進入量產，並已搭載於新款梅賽德斯-賓士CLA，該車近期獲得NCAP最高安全評級。系統目前支持免持駕駛高速公路，計畫於2026年晚些時候推出城市自主駕駛。此外，NVIDIA宣布與多家領先機器人公司合作——包括Boston Dynamics、Franka Robotics、Surgical、LG Electronics、NEURA、XRLabs與Logic Robotics——共同標準化NVIDIA Isaac與GR00T框架。同時，與西門子合作，將NVIDIA CUDA-X、AI模型與Omniverse模擬能力整合進西門子的CAE、EDA與數位雙生平台，擴展實體AI在設計、模擬、製造與運營領域的應用。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

讚賞
按讚
留言
轉發
分享

留言

0/400

暫無留言

熱門話題
查看更多
#
GateforAI重磅上線
985.1萬熱度
#
加密市場小幅下跌
461.03萬熱度
#
黃金白銀走高
1.25萬熱度
#
美伊局勢影響
19.76萬熱度
#
AI板塊逆勢上漲
14.84萬熱度

熱門 Gate Fun
查看更多

1
SHIT
SHIT
市值:$0.1持有人數:1
0.00%
2
web4.0
web4.0
市值:$2472.41持有人數:1
0.00%
3
PI
PI
市值:$0.1持有人數:2
0.00%
4
Ayan
ARGT
市值:$2491.38持有人數:2
0.00%
5
π
zaicheng
市值:$2455.17持有人數:1
0.00%

1.5 小時內的八大重磅公告：NVIDIA 的 Vera Rubin 預示 AI 推理的新時代

Vera Rubin：六款共同設計晶片實現3.6 EFLOPS單櫃性能

三大突破轉變推理經濟

從650個開源模型到代理AI藍圖：NVIDIA的軟體攻勢

Alpha-Mayo：推理自主性進入量產階段

熱門話題

GateforAI重磅上線

加密市場小幅下跌

黃金白銀走高

美伊局勢影響

AI板塊逆勢上漲

熱門 Gate Fun

SHIT

SHIT

web4.0

web4.0

PI

PI

Ayan

ARGT

π

zaicheng

置頂