Jensen Huangが2500キロの「モンスター」とともに登場、NVIDIA Vera RubinがAI産業を一新

上一次NVIDIA在CES上没带消费级显卡,已经是5年前的事了。但这次不同——Jensen Huang穿着标志性的鳄鱼皮夹克走上舞台,却带来了重量级的东西:一台重达2.5吨的服务器机柜,以及可能会重构整个AI产业的Vera Rubin计算平台。

这个用天文学家Vera Rubin命名的系统(她发现了暗物质),解决的是AI时代最紧迫的问题——10万亿美元的计算资源正在面临彻底现代化的需求。

从一台机器看懂NVIDIA如何玩"芯片整合"

当传统的摩尔定律逐渐失效,NVIDIA选择了极端整合的路线。这一次,他们打破了每代产品最多改进1-2颗芯片的传统——Vera Rubin同时重设计了6颗芯片,全部进入大规模量产阶段。

这6颗芯片分别是:

  • Vera CPU:88個Olympusコア、176スレッド並列、単一チップで2270億トランジスタ
  • Rubin GPU:推論性能50 PFLOPS(前代Blackwellの5倍)、3360億トランジスタ
  • ConnectX-9ネットカード:800Gbpsイーサネット、可プログラム可能なRDMA加速をサポート
  • BlueField-4 DPU:次世代AIストレージプラットフォーム向けに設計、1260億トランジスタ
  • NVLink-6スイッチチップ:18ノードを接続し、72個のRubin GPUを協調動作
  • Spectrum-6光学イーサネットスイッチ:512チャネル×200Gbps、3520億トランジスタ

パラメータだけ見ると退屈に思えるかもしれないが、重要な数字はこうだ——100兆パラメータのモデルを訓練するのにBlackwellシステムの4分の1の数で済む。トークン生成のコストも10分の1に下がる。

計算密度向上の裏側:エンジニアリング革命

従来、スーパーコンピュータのノード構築には43本のケーブルが必要で、組み立てに2時間かかり、ミスも起きやすかった。Vera Rubinのノードには電気的な配線は一切なく、液冷水管が6本だけ——設置時間はわずか5分に短縮された。

背面には約3.2キロの銅線が張り巡らされ、5000本のケーブルがNVLinkのバックボーンネットワークを形成し、400Gbpsの帯域を提供。Jensen Huangは冗談交じりに言った:「これを動かせるのは体力のあるCEOだけだ。」

さらに重要なのはメモリのアップグレード——NVL72システムは54TBのLPDDR5Xメモリ(前世代の3倍)と20.7TBのHBMを搭載し、HBM4の帯域幅は1.6PB/sに達する。性能は3.5〜5倍向上したが、トランジスタ数はわずか1.7倍増にとどまり、半導体プロセスの進歩を反映している。

"長尾問題"の解決:能力から応用へ

AI訓練には長年のボトルネック——コンテキストメモリ不足があった。大規模モデルは"KVキャッシュ"(キーと値のキャッシュ)を生成し、AIの"作業記憶"となる。対話が長くなると、HBM容量が足りなくなることも。

Vera Rubinの解決策は、キャビネット内にBlueField-4プロセッサを配置し、KVキャッシュを管理することだ。各ノードに4つのBlueField-4を搭載し、150TBのコンテキストストレージを提供——GPUに割り当てると、各GPUは追加で16TBのメモリを得る(GPU自身は約1TB)、伝送速度は200Gbpsを維持し、パフォーマンスのボトルネックは生じない。

分散した数十のキャビネット、数千のGPUにまたがるこれらの"メモ"を一つの統一メモリのように動作させるには、ネットワークは十分に大きく、速く、安定している必要がある。これがSpectrum-Xの役割だ——世界初の"生成式AI向けイーサネットプラットフォーム"であり、TSMCのシリコンフォトニクス技術を統合し、512チャネル×200Gbpsの通路を持つ。

Jensen Huangは計算した——1GWのデータセンターコストは500億ドルだが、Spectrum-Xはスループットを25%向上させ、50億ドルの節約になると。彼は冗談めかして言った:「このネットワークシステムはほぼ無料だと言える。」

"オープンソースの衝撃"と産業の方向性

冒頭のスピーチに戻ると、Jensen Huangは数字を投げかけた——過去10年で投入された10兆ドルの計算資源は全面的にアップグレードされつつある。しかしこれは単なるハードウェアの更新だけでなく、プログラミングのパラダイムの変革でもある。

昨年のDeepSeek V1のオープンソース突破は、皆を驚かせた。最初のオープンソース推論システムとして、業界全体に開発の波をもたらした。中国のKimi K2やDeepSeek V3.2は、現時点でオープンソースのトップ2モデルだ。

Jensen Huangは認めた——オープンソースモデルは業界の最先端から6ヶ月遅れることもあるが、半年ごとに新モデルが登場する。この速度はスタートアップ、大手、研究機関のいずれも遅れたくないと焦る要因だ——NVIDIAも例外ではない。だから彼らは単に"シャベルを売る"だけでなく、数十億ドル規模のDGX Cloudスーパーコンピュータに投資し、La Proteina(タンパク質合成)やOpenFold 3などのモデルも開発している。

Nemotronのオープンソースモデル群は、音声、多モーダル、RAG、安全性などの分野をカバーし、多くのランキングで好成績を収めており、企業の導入も増えている。

物理AIの三層計算機

もし大規模言語モデルが"デジタル世界"の問題を解決したとしたら、次の野望は"物理世界"の征服だ。AIに物理法則を理解させ、現実で生き抜くには、非常に希少なデータが必要となる。

Jensen Huangは物理AIに必要な"三台のコンピュータ"を次のようにまとめた:

  1. 訓練用コンピュータ——高性能な訓練用カードを搭載したシステム(例:GB300アーキテクチャ)
  2. 推論用コンピュータ——ロボットや車に埋め込まれる"小脳"で、リアルタイムの意思決定と実行を担当
  3. シミュレーション用コンピュータ——OmniverseやCosmosを含み、AIが仮想環境で学習・フィードバックを行う

Cosmosシステムは、AIに大量の物理世界の訓練環境を生成できる。これを基盤に、Jensen Huangは世界初のエンドツーエンド自動運転モデルAlpamayoを正式に発表した。

従来のシステムと異なり、Alpamayoは真のエンドツーエンド訓練だ。その突破点は、自動運転の"長尾問題"——未知の複雑な状況に直面したとき、Alpamayoは硬直したコードの実行ではなく、人間のように推論することだ。"次に何をすべきか、なぜそうするのかを教えてくれる。"デモでは、この車の運転スタイルは自然で流暢、複雑な道路状況も基本ルールに分解して対応できている。

既に実現例もあり——Mercedes CLAに搭載されたAlpamayo技術は、今年第1四半期に米国で初公開、その後欧州やアジアへ展開される。この車はNCAPで世界最安全車に認定されており、NVIDIAの独自設計"二重安全スタック"のおかげだ——エンドツーエンドAIの不確実性時に、システムは自動的に従来のより安全なモードに切り替わる。

ロボット軍団と工場はロボットに

NVIDIAのロボット戦略もまた壮大だ。すべてのロボットにはJetsonミニコンピュータを搭載し、OmniverseのIsaacシミュレータで訓練を行う。これらの技術は、Synopsys、Cadence、Siemensなどの産業エコシステムに統合されている。

舞台にはBoston DynamicsやAgilityのヒューマノイドロボット、四足歩行ロボット、ディズニーのロボットも登場した。Jensen Huangは冗談めかして言った:「これらのかわいいヤツらは設計・製造され、コンピュータ内でテスト・検証も済ませて、実際の重力に触れる前に一度"生き"ているんだ。」

NVIDIAの究極の夢は、基盤のチップ設計からシステムアーキテクチャ、工場のシミュレーションまで、すべてを物理AIで加速すること——これには、新しい地域や応用シナリオの産業展開も含まれる。例えば、アジアに構築された物理テストマップ(mapa fizyczna azji)を使い、自動運転やロボットの異なる地理条件下での性能を検証する。

"戦時中に武器を売る"の論理

もしJensen Huangでなければ、これはあるAIモデル会社の発表会かと思うだろう。AIバブルの話題が高まり、摩尔定律が鈍化する中、Jensen Huangは私たちのAIへの信頼を再燃させようとしている——それは、彼が本当にできることを見せることで。

超強力なチッププラットフォームVera Rubinから、応用とソフトウェアの重点、さらに物理AI、自動運転、ロボットなどの具体的な事例まで——彼らはかつて仮想世界のためにチップを作り、今は自ら実演し、物理AIに焦点を当てて、現実の物理世界で激しい競争を繰り広げている。

結局のところ、「戦時中」だからこそ、武器は売れ続けるのだ。


おまけ:CESの時間制限のため、Jensen Huangはすべてのスライドを語り終えなかった。未公開部分はユーモラスな短編映画に編集された。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン