Jensen Huangが2500キロの「モンスター」とともに登場、NVIDIA Vera RubinがAI産業を一新

2026-01-15 14:34:09

上一次NVIDIA在CES上没带消费级显卡，已经是5年前的事了。但这次不同——Jensen Huang穿着标志性的鳄鱼皮夹克走上舞台，却带来了重量级的东西：一台重达2.5吨的服务器机柜，以及可能会重构整个AI产业的Vera Rubin计算平台。

这个用天文学家Vera Rubin命名的系统（她发现了暗物质），解决的是AI时代最紧迫的问题——10万亿美元的计算资源正在面临彻底现代化的需求。

从一台机器看懂NVIDIA如何玩"芯片整合"

当传统的摩尔定律逐渐失效，NVIDIA选择了极端整合的路线。这一次，他们打破了每代产品最多改进1-2颗芯片的传统——Vera Rubin同时重设计了6颗芯片，全部进入大规模量产阶段。

这6颗芯片分别是：

Vera CPU：88個Olympusコア、176スレッド並列、単一チップで2270億トランジスタ
Rubin GPU：推論性能50 PFLOPS（前代Blackwellの5倍）、3360億トランジスタ
ConnectX-9ネットカード：800Gbpsイーサネット、可プログラム可能なRDMA加速をサポート
BlueField-4 DPU：次世代AIストレージプラットフォーム向けに設計、1260億トランジスタ
NVLink-6スイッチチップ：18ノードを接続し、72個のRubin GPUを協調動作
Spectrum-6光学イーサネットスイッチ：512チャネル×200Gbps、3520億トランジスタ

パラメータだけ見ると退屈に思えるかもしれないが、重要な数字はこうだ——100兆パラメータのモデルを訓練するのにBlackwellシステムの4分の1の数で済む。トークン生成のコストも10分の1に下がる。

計算密度向上の裏側：エンジニアリング革命

従来、スーパーコンピュータのノード構築には43本のケーブルが必要で、組み立てに2時間かかり、ミスも起きやすかった。Vera Rubinのノードには電気的な配線は一切なく、液冷水管が6本だけ——設置時間はわずか5分に短縮された。

背面には約3.2キロの銅線が張り巡らされ、5000本のケーブルがNVLinkのバックボーンネットワークを形成し、400Gbpsの帯域を提供。Jensen Huangは冗談交じりに言った：「これを動かせるのは体力のあるCEOだけだ。」

さらに重要なのはメモリのアップグレード——NVL72システムは54TBのLPDDR5Xメモリ（前世代の3倍）と20.7TBのHBMを搭載し、HBM4の帯域幅は1.6PB/sに達する。性能は3.5〜5倍向上したが、トランジスタ数はわずか1.7倍増にとどまり、半導体プロセスの進歩を反映している。

"長尾問題"の解決：能力から応用へ

AI訓練には長年のボトルネック——コンテキストメモリ不足があった。大規模モデルは"KVキャッシュ"（キーと値のキャッシュ）を生成し、AIの"作業記憶"となる。対話が長くなると、HBM容量が足りなくなることも。

Vera Rubinの解決策は、キャビネット内にBlueField-4プロセッサを配置し、KVキャッシュを管理することだ。各ノードに4つのBlueField-4を搭載し、150TBのコンテキストストレージを提供——GPUに割り当てると、各GPUは追加で16TBのメモリを得る（GPU自身は約1TB）、伝送速度は200Gbpsを維持し、パフォーマンスのボトルネックは生じない。

分散した数十のキャビネット、数千のGPUにまたがるこれらの"メモ"を一つの統一メモリのように動作させるには、ネットワークは十分に大きく、速く、安定している必要がある。これがSpectrum-Xの役割だ——世界初の"生成式AI向けイーサネットプラットフォーム"であり、TSMCのシリコンフォトニクス技術を統合し、512チャネル×200Gbpsの通路を持つ。

Jensen Huangは計算した——1GWのデータセンターコストは500億ドルだが、Spectrum-Xはスループットを25%向上させ、50億ドルの節約になると。彼は冗談めかして言った：「このネットワークシステムはほぼ無料だと言える。」

"オープンソースの衝撃"と産業の方向性

冒頭のスピーチに戻ると、Jensen Huangは数字を投げかけた——過去10年で投入された10兆ドルの計算資源は全面的にアップグレードされつつある。しかしこれは単なるハードウェアの更新だけでなく、プログラミングのパラダイムの変革でもある。

昨年のDeepSeek V1のオープンソース突破は、皆を驚かせた。最初のオープンソース推論システムとして、業界全体に開発の波をもたらした。中国のKimi K2やDeepSeek V3.2は、現時点でオープンソースのトップ2モデルだ。

Jensen Huangは認めた——オープンソースモデルは業界の最先端から6ヶ月遅れることもあるが、半年ごとに新モデルが登場する。この速度はスタートアップ、大手、研究機関のいずれも遅れたくないと焦る要因だ——NVIDIAも例外ではない。だから彼らは単に"シャベルを売る"だけでなく、数十億ドル規模のDGX Cloudスーパーコンピュータに投資し、La Proteina（タンパク質合成）やOpenFold 3などのモデルも開発している。

Nemotronのオープンソースモデル群は、音声、多モーダル、RAG、安全性などの分野をカバーし、多くのランキングで好成績を収めており、企業の導入も増えている。

物理AIの三層計算機

もし大規模言語モデルが"デジタル世界"の問題を解決したとしたら、次の野望は"物理世界"の征服だ。AIに物理法則を理解させ、現実で生き抜くには、非常に希少なデータが必要となる。

Jensen Huangは物理AIに必要な"三台のコンピュータ"を次のようにまとめた：

訓練用コンピュータ——高性能な訓練用カードを搭載したシステム（例：GB300アーキテクチャ）
推論用コンピュータ——ロボットや車に埋め込まれる"小脳"で、リアルタイムの意思決定と実行を担当
シミュレーション用コンピュータ——OmniverseやCosmosを含み、AIが仮想環境で学習・フィードバックを行う

Cosmosシステムは、AIに大量の物理世界の訓練環境を生成できる。これを基盤に、Jensen Huangは世界初のエンドツーエンド自動運転モデルAlpamayoを正式に発表した。

従来のシステムと異なり、Alpamayoは真のエンドツーエンド訓練だ。その突破点は、自動運転の"長尾問題"——未知の複雑な状況に直面したとき、Alpamayoは硬直したコードの実行ではなく、人間のように推論することだ。"次に何をすべきか、なぜそうするのかを教えてくれる。"デモでは、この車の運転スタイルは自然で流暢、複雑な道路状況も基本ルールに分解して対応できている。

既に実現例もあり——Mercedes CLAに搭載されたAlpamayo技術は、今年第1四半期に米国で初公開、その後欧州やアジアへ展開される。この車はNCAPで世界最安全車に認定されており、NVIDIAの独自設計"二重安全スタック"のおかげだ——エンドツーエンドAIの不確実性時に、システムは自動的に従来のより安全なモードに切り替わる。

ロボット軍団と工場はロボットに

NVIDIAのロボット戦略もまた壮大だ。すべてのロボットにはJetsonミニコンピュータを搭載し、OmniverseのIsaacシミュレータで訓練を行う。これらの技術は、Synopsys、Cadence、Siemensなどの産業エコシステムに統合されている。

舞台にはBoston DynamicsやAgilityのヒューマノイドロボット、四足歩行ロボット、ディズニーのロボットも登場した。Jensen Huangは冗談めかして言った：「これらのかわいいヤツらは設計・製造され、コンピュータ内でテスト・検証も済ませて、実際の重力に触れる前に一度"生き"ているんだ。」

NVIDIAの究極の夢は、基盤のチップ設計からシステムアーキテクチャ、工場のシミュレーションまで、すべてを物理AIで加速すること——これには、新しい地域や応用シナリオの産業展開も含まれる。例えば、アジアに構築された物理テストマップ（mapa fizyczna azji）を使い、自動運転やロボットの異なる地理条件下での性能を検証する。