Gate Booster 第 4 期:發帖瓜分 1,500 $USDT
🔹 發布 TradFi 黃金福袋原創內容,可得 15 $USDT,名額有限先到先得
🔹 本期支持 X、YouTube 發布原創內容
🔹 無需複雜操作,流程清晰透明
🔹 流程:申請成為 Booster → 領取任務 → 發布原創內容 → 回鏈登記 → 等待審核及發獎
📅 任務截止時間:03月20日16:00(UTC+8)
立即領取任務:https://www.gate.com/booster/10028?pid=allPort&ch=KTag1BmC
更多詳情:https://www.gate.com/announcements/article/50203
英偉達 GTC 大會全文:黃仁勳宣告推理時代到來,龍蝦就是新操作系統!
來源:華爾街見聞
撰文:鮑奕龍
在 GTC 2026 大會上,英偉達 CEO 黃仁勳將公司定位為「AI 工廠」建構者,稱「到 2027 年將看到至少 1 萬億美元的高確信度需求」。他提出「Token 工廠經濟學」,強調每瓦性能是商業變現的核心。黃仁勳斷言 Agent(智能體)將終結傳統 SaaS 模式,未來「年薪+Token 預算」將成為職場新標配。
開場致辭
主持人: 歡迎英偉達創始人兼首席執行官黃仁勳登台。
黃仁勳,創始人兼首席執行官:
歡迎來到 GTC。這是一場技術大會,看到這麼多人一大早就排隊入場,非常高興。
今天我們將圍繞三大平台展開討論:CUDA-X 平台、系統平台,以及全新的 AI 工廠平台。當然,最重要的是生態系統。
首先,我要感謝我們的"賽前熱身"主持人,他們表現出色:來自 Conviction 的 Sarah Guo、紅杉資本的 Alfred Lin(英偉達的第一位風險投資人),以及英偉達第一位重要機構投資人 Gavin Baker。這三位對技術有著深刻的理解,在技術生態系統中擁有廣泛的影響力。此外,也感謝我親自挑選的所有貴賓。
同時,我要感謝所有參會企業。英偉達作為平台公司,擁有技術、平台和豐富的生態系統。今天,涵蓋萬億美元產業的企業幾乎全部匯聚於此——450 家企業贊助了本次活動,非常感謝。
本次大會共設 1,000 場技術專題,匯聚 2,000 位演講嘉賓,將涵蓋人工智能"五層蛋糕"的每一層——從土地、電力與基礎設施,到晶片、平台、模型,以及最終推動整個產業騰飛的各類應用。
CUDA的 20 年歷程
今年是 CUDA 誕生 20 週年。
20 年來,我們始終致力於這一架構——這項革命性的發明:SIMT(單指令多執行緒),允許標量代碼衍生為多執行緒應用,比傳統方式更易於編程。近年來,我們還新增了 Tiles(瓦片)支持,幫助開發者更便捷地對 Tensor Core 及當今 AI 數學結構進行編程。
迄今為止,CUDA 已積累了數千種工具、編譯器、框架與庫,在開源社群中擁有數十萬個公開專案,並已深度整合至每一個主流生態系統中。
飛輪效應與安裝基礎
下面這張圖,基本上描述了英偉達戰略的全貌。
最難實現、也最具戰略價值的,是底層的安裝基礎。歷經 20 年,我們在全球構建了數億顆運行 CUDA 的 GPU 和計算系統。我們覆蓋了每一家雲服務商和每一家電腦廠商,服務於幾乎每一個行業。
CUDA 的安裝基礎,正是飛輪加速的根本原因。龐大的安裝基礎吸引開發者,開發者創造新算法,新算法催生突破——例如深度學習的誕生。這些突破開闢全新市場,新市場匯聚更多生態夥伴,進而形成更大的安裝基礎。這一飛輪正在持續加速。
目前,英偉達庫的下載量正以驚人速度增長,且增速仍在不斷提升。這一飛輪使得計算平台能夠持續支撐海量應用和層出不窮的技術突破。
更重要的是,它也使基礎設施擁有了極長的使用壽命。原因很簡單:英偉達 CUDA 能運行的應用範圍極廣,覆蓋 AI 生命週期的每個階段、每種資料處理平台,以及各類科學原理求解器,因此一旦安裝英偉達 GPU,其使用壽命便極為可觀。
這也解釋了為什麼我們六年前發布的 Ampere 架構,其雲端定價至今仍在上漲。
與此同時,隨著我們持續更新軟體,計算成本也在不斷下降——這不僅體現在首次部署時的性能躍升,更體現在加速計算帶來的長期持續降本效應。由於所有 GPU 在架構上互相兼容,我們願意持續支援和維護全球每一塊 GPU。安裝基礎越大,每次新優化所惠及的用戶就越多。
這一動態組合,使英偉達架構在擴大覆蓋範圍、加速增長的同時,持續壓低計算成本,從而反過來推動新一輪增長。
CUDA 的起點:GeForce
CUDA 的旅程,實際上始於 25 年前的 GeForce。
GeForce 是英偉達有史以來最成功的行銷。 我們從你們還年幼、尚未具備消費能力時就開始吸引未來的客戶——那時是你們的父母在為你們買單,年復一年,直到有一天你們成長為出色的計算機科學家,成為真正的開發者。
25 年前,我們發明了可編程著色器——世界上第一款可編程加速器,也是像素著色器的起點。這一發明驅動我們不斷深入探索,5 年後催生了 CUDA。
將 CUDA 從 GeForce 推廣到每一台計算機,是我們當時最重大的投資之一——即便當時難以負擔,它也消耗了公司絕大部分利潤。我們堅信其潛力,儘管初期艱辛,但經過 20 年、13 代架構的堅守,CUDA 如今已無處不在。
大約 8 年前,我們推出了 RTX,對架構進行了徹底重新設計,引入了兩項當時全新的理念:硬體光線追踪與 AI 驅動的圖形渲染。就如同 GeForce 將 AI 帶到了世界面前——讓 Alex Krizhevsky、Ilya Sutskever、Geoffrey Hinton、Andrew Ng 等人發現 GPU 是加速深度學習的利器,從而點燃了 AI 的大爆炸——如今,AI 也將反過來徹底革新計算機圖形學。
神經渲染:DLSS 5
今天,我要向大家展示圖形技術的未來。我們稱之為神經渲染——3D 圖形與人工智能的融合,這就是 DLSS 5。
效果震撼,對吧?我們將可控的 3D 圖形(虛擬世界的"結構化資料")與生成式 AI(概率計算)融合在一起:一個完全可預測,另一個概率驅動卻高度逼真。兩者結合,生成的內容既美觀、逼真,又完全可控。
結構化資訊與生成式 AI 的融合,將在一個又一個行業中不斷重演。結構化資料,是可信 AI 的基石。
結構化資料與非結構化資料平台
接下來這張圖可能會讓你們有些震驚,但請耐心聽我說完。
結構化資料——SQL、Spark、Pandas、Velox,以及 Snowflake、Databricks、Amazon EMR、Azure Fabric、Google BigQuery 等重要平台——都在處理資料框(Data Frame)。這些資料框本質上是巨型電子表格,承載著所有商業資訊,是企業計算的"基準事實"。
在 AI 時代,這些結構化資料將被 AI 高速調用,因此必須被極致加速。未來的 AI Agent 也將廣泛使用結構化資料庫。
非結構化資料則代表著世界上絕大多數的資訊:向量資料庫、PDF、影片、語音……全球每年生成的資訊中,約 90%都是非結構化資料。過去,這些資料幾乎毫無用處——我們將它們存入檔案系統,卻無法檢索、無法查詢。
現在,AI 改變了這一切。就像 AI 解決了多模態感知與理解問題,同樣的技術可以讀取 PDF、理解其含義,並將其嵌入可檢索、可查詢的更大結構中。
為此,英偉達創建了兩個基礎庫:
cuDF:用於資料框(Data Frame)和結構化資料加速
cuVS:用於向量存儲(Vector Store)、語義資料和非結構化 AI 資料加速
這兩個平台將成為未來最重要的計算平台之一。
今天,我們正式宣布多項合作:
IBM(SQL 的發明者)正在使用 cuDF 加速其 WatsonX 資料平台
戴爾與我們合作打造了 Dell AI 資料平台,整合 cuDF 與 cuVS,專為 AI 時代設計
Google Cloud:我們加速其 Vertex AI 和 BigQuery 平台;以 Snapchat 為例,我們幫助其將計算成本降低了近 80%
AWS:我們加速 EMR、SageMaker 和 Bedrock,並將把 OpenAI 引入 AWS,推動其大規模雲端運算消費
Microsoft Azure:我們加速 Azure AI Foundry,深度支援必應搜尋,並擴展 Azure 區域部署
CoreWeave:全球第一家 AI 原生雲,為 GPU 托管和 AI 推理而生
Oracle:我們是 Oracle 的第一位 AI 客戶
Palantir + 戴爾:三方合作,可在任意國家、任意隔離區域、完全本地化地部署 AI 平台
英偉達的核心戰略:垂直整合,水平開放
英偉達是全球首家垂直整合、同時水平開放的計算公司。
加速計算不是一個晶片問題,也不是一個系統問題,其核心是應用加速。要持續為每個應用領域帶來顯著加速和成本降低,就必須深入理解應用、理解領域、理解算法,並在每一種部署場景中落地實施——無論是資料中心雲端、本地部署、邊緣計算還是機器人系統。
這就是英偉達必須深耕一個又一個垂直領域的原因。我們在理解算法的基礎上,將其整合進計算平台,開放給全世界使用。
本屆 GTC 幾乎涵蓋了英偉達生態的每一個垂直領域,包括:
自動駕駛
金融服務(本次 GTC 與會者中占比最大的行業,希望來的是開發者,不是交易員)
醫療健康(正經歷其"ChatGPT 時刻")
工業製造
娛樂與遊戲
機器人(110 台機器人參展,幾乎每家機器人公司都在與英偉達合作)
電信(約 2 萬億美元規模的行業,基站將演變為 AI 邊緣計算基礎設施)
我們在本屆大會上宣布 100 個庫和約 40 個模型的更新。這些庫是公司的核心資產,是激活計算平台、解決實際問題的關鍵。
其中最重要的庫之一是 cuDNN(CUDA 深度神經網路庫),它徹底革命性地改變了人工智能,點燃了現代 AI 的大爆炸。
推理轉折點的到來
過去兩年裡,究竟發生了什麼?三件大事推動了這一切:
第一:ChatGPT 與生成式 AI 時代的開啟(2022 年底至 2023 年)。 AI 不僅能感知與理解,還能翻譯、創作,生成全新內容。生成式計算從根本上改變了計算機的架構方式與建設邏輯。
第二:推理 AI 的崛起(o 1 及 o 3 模型)。 推理 AI 使模型能夠反思、規劃,將複雜問題分解為可處理的步驟,讓 AI 更加值得信賴,並扎根於事實。這使 ChatGPT 的使用量急劇攀升,同時也大幅增加了輸入與輸出 Token 的計算量。
第三:Claude Code 與 Agentic AI 的誕生。 這是第一個真正意義上的 Agentic 模型,能夠讀取檔案、撰寫程式碼、編譯、測試、評估,並迭代優化。Claude Code 徹底革新了軟體工程。如今英偉達內部,每一位軟體工程師都在使用 AI Agent 輔助程式設計。
AI 經歷了從"感知"到"生成",從"生成"到"推理",再從"推理"到"執行"的演進歷程——如今的 AI 能夠完成真正富有成效的工作。
推理轉折點已然到來。 AI 每次思考、執行、讀取、推理,都需要進行推斷(Inference),Token 生成需求呈爆炸式增長。過去兩年間,單次工作的計算需求提升了約 10,000 倍,使用量提升了約 100 倍,計算總需求的增幅接近 100 萬倍。
從 5000 億到 1 萬億美元
去年 GTC 上,我提到我們看到了至 2026 年、對 Blackwell 和 Rubin 約 5000 億美元的高確信度需求。
今天,在 GTC 整整一年後,站在當下,我可以清晰地看到:至少到 2027 年,需求將達到 1 萬億美元。
而且,我确信實際計算需求將遠高於此。
去年是英偉達的推理之年。我們全力確保在訓練和後訓練之外,在 AI 生命週期的每個階段都表現卓越,從而使基礎設施投資能夠長期持續發揮價值。
我們也很高興看到 Anthropic 選擇了英偉達,Meta SL 也選擇了英偉達。當前,開源模型已接近前沿水平,並已無處不在。英偉達是目前全球唯一能在語言、生物學、計算機圖形學、計算機視覺、語音、蛋白質與化學、機器人等所有 AI 領域,跨所有 AI 模型,覆蓋邊緣到雲端全場景的計算平台。
我們架構的"可遷移性(Fungibility)",使其成為構建 AI 基礎設施時最低成本、最高確信度的平台。當你投入萬億美元建設基礎設施時,你需要完全的信心——英偉達是目前全球唯一能讓你充滿信心部署的計算平台,無論是雲端、本地還是任何國家。
目前,我們 60%的業務來自五大超大規模雲服務商,另外 40%來自區域雲、主權雲、企業、工業、機器人、邊緣和超算等多個領域。這種多元化的覆蓋本身就是韌性所在——AI 已不再是單一應用,而是一場真正意義上的計算平台轉變。
推理性能的突破
我們在推理優化上取得了根本性突破:
這是有史以來最全面的 AI 推理性能測評(來自 Semi Analysis)。分析維度如下:
縱軸(每瓦 Token 數):反映吞吐量。每個資料中心都受電力約束,1 吉瓦的工廠無法變成 2 吉瓦,必須在有限電力內最大化 Token 產出。
橫軸(推理速度/Token 速率):反映互動性與 AI"智能度"。速度越快,模型越大、上下文越長、思考越深——也就越"聰明"。
結果令人震驚:
從 Hopper H 200 到 Grace Blackwell,摩爾定律預期能帶來約 1.5 倍的提升,但實際提升達到 35 倍的每瓦性能。Semi Analysis 的 Dylan Patel 甚至指出我報告的數據過於保守——實際是 50 倍。
這意味着英偉達的每 Token 成本是全球最低。一個吉瓦資料中心建設成本約 400 億美元(攤銷 15 年),無論如何都必須付出這筆固定成本——因此必須在其上安裝性能最優的計算系統,才能實現最低的 Token 成本。這一點,目前無可匹敵。
以 Fireworks AI 為例:我們更新了他們的軟體後,同一套系統的 Token 速率從約 700 tokens/秒提升至近 5,000 tokens/秒,提升了 7 倍。這就是極致協同設計的威力。
Token 工廠的商業邏輯:
未來每家雲服務商、AI 公司都將從 Token 工廠的視角審視其業務。不同 Token 速率對應不同服務等級與定價:
免費層:高吞吐、低速度
基礎層:約 3 美元/百萬 Token
標準層:約 6 美元/百萬 Token
高級層:約 45 美元/百萬 Token
頂級層:約 150 美元/百萬 Token(高速、超長上下文、最大模型)
以 Grace Blackwell 為例:與 Hopper 相比,在最具商業價值的服務層級,其吞吐量提升了 35 倍,可大幅增加可變現容量,將整體資料中心收益提升約 5 倍。
Vera Rubin:下一代架構
現在,我不再只展示一顆晶片——我展示的是整個系統。這就是 Vera Rubin。
Vera Rubin 專為 Agentic 系統設計,其核心邏輯非常清晰:
大型語言模型將越來越大,需要生成更多 Token、更快速地思考;
AI Agent 將頻繁訪問記憶(KV Cache)、結構化資料(cuDF)和非結構化資料(cuVS);
存儲系統將承受巨大壓力;
工具調用要求 CPU 具備極高的單執行緒性能。
為此,我們打造了全新的 Vera CPU——全球唯一使用 LPDDR 5 的資料中心 CPU,兼具極高單執行緒性能、出色資料處理能力和無與倫比的能效比。
Vera Rubin 系統的核心特性:
100%液冷,所有線纜大幅簡化
安裝時間從兩天縮短至兩小時
使用 45°C 熱水冷卻,大幅降低資料中心冷卻能耗
搭載第六代 NVLink 交換系統(全球唯一)——完全液冷,極難實現,我為團隊感到無比自豪
全球首款 CPO Spectrum-X 交換機(共封裝光學)已量產:光子直接集成至晶片,電子信號轉換為光子,直接連接至晶片。該工藝與台積電聯合研發,我們是全球唯一量產者,稱為"CoOP",徹底革命性。
各系列 CPU 也進入量產,已確定將成為數十億美元規模的獨立業務
Rubin Ultra(超級版):
Rubin Ultra 采用全新"Kyber"機架,支持 144 顆 GPU 構成單一 NVLink 域。計算節點從正面插入,NVLink 交換機從背面通過中板連接,整體構成一台巨型計算機。
在技術路線圖方面:
Blackwell(當前):Oberon 系統,支持 NVLink 72
Vera Rubin:Kyber 機架(NVLink 144)+ Oberon 銅纜/光學擴展至 NVLink 576
Vera Rubin Ultra:Rubin Ultra 晶片 + LP 35(首次引入 NVFP 4 計算結構)
Feynman(下一代):全新 GPU + LP 40 + Rosa CPU(Rosa-lin 簡稱)+ Bluefield 5 + CX 10 + 銅纜與 CPO 雙模擴展
Grok 收購與異構推理突破
我們收購了 Grok 的技術團隊,並獲得了技術授權,進行深度整合。
Grok 處理器的核心特點:
確定性資料流處理器,靜態編譯,由編譯器調度計算
計算與資料同時到達,完全軟體調度,無動態調度
擁有海量 SRAM,專為推理這一單一工作負載設計
其局限在於:單顆 Grok 晶片僅有 500 MB 儲存(相比之下,單顆 Rubin 晶片有 288 GB),無法容納大型模型的參數及 KV Cache,限制了其規模化能力——直到我們有了一個絕妙的想法。
Dynamo:推理解耦框架
我們開發了 Dynamo 軟體,將推理流程重新架構:
預填充(Prefill)階段:在 Vera Rubin 上執行(需要大量算力)
解碼(Decode)階段的 Attention 計算:在 Vera Rubin 上執行(需要大量算力)
解碼階段的前饋網路(FFN)/ Token 生成:在 Grok 晶片上執行(需要大帶寬、低延遲)
兩款架構截然不同的處理器——一個專為高吞吐量,一個專為低延遲——通過 Dynamo 緊密耦合,延遲降低約 50%。
結果:在最具商業價值的服務層級,性能提升 35 倍,同時開闢了此前從未有過的全新推理性能層級。
Grok LP 30 由三星代工製造,目前已投入量產,預計 2026 年第三季度開始出貨。
Grok 的最優部署策略:
若工作負載以高吞吐量為主:100% Vera Rubin
若有大量高價值程式碼生成或高速 Token 需求:建議將 25%算力配置為 Grok,其餘 75%保持 Vera Rubin。
AI 工廠規模與展望
在一個吉瓦級工廠中,僅用兩年時間,透過上述架構優化,Token 生成速率將從 2200 萬提升至 7 億,提升幅度 350 倍。
這就是極致協同設計的力量——垂直整合、水平開放,讓所有人共享這一成果。
隨著 AI 工廠規模急劇擴張,我們發現一個關鍵問題:資料中心中各類技術供應商過去從未互相接觸,各自獨立開發,導致大量能源浪費。
為此,我們創建了英偉達 DSX 平台,基於 Omniverse,讓所有合作夥伴能夠在虛擬世界中共同設計吉瓦級 AI 工廠——涵蓋機械、熱管理、電氣、網路的全系統仿真,並與電網即時互聯,透過 Max-Q 技術動態優化功耗與冷卻。
我們相信,僅這一平台就能釋放約兩倍的效率提升——在萬億美元規模下,這是極其巨大的價值。
此外,英偉達還將進軍太空:Thor 晶片已通過輻射認證,部署於衛星之中。我們正與合作夥伴開發 Vera Rubin Space-1,在太空中建設資料中心(需解決純輻射散熱的工程挑戰)。
OpenClaw:AI Agent 的操作系統
現在談談一個重大新發現。
Peter Steinberger 開發了一款軟體,叫做 OpenClaw。它成為了有史以來最受歡迎的開源專案,在短短幾周內超越了 Linux 三十年的傳播速度。
OpenClaw 是什麼? 它是一個 Agentic 系統,能夠:
連接大型語言模型
存取工具和檔案系統
執行調度和定時任務
將問題分解為逐步執行的子任務
生成並調用子 Agent
支援多模態互動(文字、語音、手勢等)
換言之,OpenClaw 本質上是 Agentic 計算機的作業系統。就像 Windows 使個人電腦成為可能,OpenClaw 使個人 Agent 成為可能。
每家企業的關鍵問題已變為:你的 OpenClaw 策略是什麼?
就像曾經每家公司都需要 Linux 策略、HTTP/HTML 策略、Kubernetes 策略,今天每家公司都必須有 OpenClaw 策略和 Agentic 系統策略。
企業 IT 的範式轉變:
舊模式:資料中心存儲檔案 → 軟體工具 → 人類使用工具
新模式:每一家 SaaS 公司都將成為 AaaS(Agentic as a Service)公司,提供專業化的 Agent 服務。
然而,企業內部的 Agentic 系統存在重大安全挑戰:它可以存取敏感資訊、執行程式碼、對外通訊。為此,我們與 Peter Steinberger 合作,聯合全球頂尖安全專家,開發了 OpenClaw Enterprise 版本,基於 OpenShell 安全技術,配備策略引擎、網路護欄和隱私路由器,打造了企業級安全的參考架構,我們將其命名為 NemoClaw,可直接下載使用。
英偉達開放模型計畫
英偉達已在每個 AI 領域的前沿模型上確立了領導地位:
模型
領域
Nemotron
大型語言模型
Cosmos
世界基礎模型
GROOT
通用機器人模型
Alpamayo
自動駕駛
BioNeMo
數位生物學/藥物發現
PhysicsNeMo
AI 物理仿真
今天,我們正式宣布成立 Nemotron 聯盟,與以下公司合作共同打造 Nemotron 4:
BlackForest Labs(圖像生成)
Cursor(程式碼編輯)
LangChain(自訂 Agent 架構,十億次下載)
Mistral(開源大模型)
Perplexity(AI 搜索)
Reflection(多模態 Agentic 系統)
Sarvam(印度 AI 公司)
Thinking Machines(Mira Murati 創立的實驗室)
這些公司正在與我們合作,共同將 NemoClaw 參考設計、英偉達 Agentic AI 工具包以及全系列開放模型深度整合到各自的產品與服務中。
物理 AI 與機器人
除數位 Agent 之外,我們長期致力於物理 AI 與機器人領域。
我們為機器人系統打造了三台關鍵計算機:
訓練計算機
合成資料生成與仿真計算機
機器人本體內建計算機
我們與 Siemens、Cadence 等眾多合作夥伴深度整合,並宣布了一系列重大合作:
自動駕駛領域: 自動駕駛的"ChatGPT 時刻"已經到來。今天,我們宣布四家全新 RoboTaxi 合作夥伴:比亞迪、現代、日產、吉利,加上之前的 Mercedes-Benz、豐田、通用,每年合計生產 1800 萬輛汽車,全面接入英偉達 RoboTaxi Ready 平台。同時,我們宣布與 Uber 達成重大合作,將在多個城市部署 RoboTaxi 車輛並接入其網路。
工業機器人領域: 我們與 ABB、Universal Robots、KUKA 及卡特彼勒等眾多工業機器人公司合作,將物理 AI 模型與仿真系統整合部署至全球製造產線。
電信領域: T-Mobile 也出現在這裡——未來的無線基站將演變為英偉達 Aerial AI RAN,能夠動態推理流量、自適應調整波束賦形,在提升訊號品質的同時顯著節省能耗。
最後,我們展示了與迪士尼聯合開發的"奧拉夫"機器人——基於 Jetson 計算平台、Omniverse 訓練環境,以及與迪士尼、DeepMind 聯合開發的 Newton 物理求解器(運行於英偉達 Warp 之上),實現了真實物理世界中的自適應運動。這是物理 AI 的精彩呈現,也是未來主題公園的生動預演。
總結
本次 GTC,我們圍繞四大核心主題展開:
推理轉折點——AI 從"能理解"到"能生成"到"能推理"再到"能工作"的躍遷,計算需求暴增百萬倍,推理轉折點正式到來;
AI 工廠——資料中心正在從存儲檔案的"資料中心"演變為生產 Token 的"AI 工廠",Vera Rubin 將在每一服務層級實現約 5 倍的收益提升;
OpenClaw 與 Agent 革命——企業 IT 正在經歷深刻變革,每家公司都必須制定 Agent 策略,NemoClaw 提供了安全可用的參考設計;
物理 AI 與機器人——自動駕駛、工業機器人、人形機器人,物理 AI 的時代已經到來。
祝大家 GTC 愉快,謝謝!