Jensen Huang mang theo "quái vật" nặng 2500kg, NVIDIA Vera Rubin làm mới ngành công nghiệp AI hoàn toàn

Lần cuối cùng NVIDIA mang card đồ họa dành cho tiêu dùng đến CES đã là cách đây 5 năm. Nhưng lần này khác biệt — Jensen Huang diện chiếc áo khoác cá sấu đặc trưng bước lên sân khấu, mang theo những thứ trọng lượng nặng nề: một tủ máy chủ nặng 2.5 tấn và nền tảng tính toán Vera Rubin có thể sẽ định hình lại toàn bộ ngành công nghiệp AI.

Hệ thống này (được đặt theo tên nhà thiên văn Vera Rubin — người phát hiện ra vật chất tối) giải quyết vấn đề cấp bách nhất của thời đại AI — 100 nghìn tỷ đô la tài nguyên tính toán đang đối mặt với nhu cầu hiện đại hóa toàn diện.

Từ một máy móc hiểu cách NVIDIA chơi “tích hợp chip”

Khi quy luật Moore truyền thống dần mất hiệu lực, NVIDIA chọn con đường tích hợp cực đoan. Lần này, họ phá vỡ truyền thống mỗi thế hệ sản phẩm chỉ cải tiến 1-2 chip — Vera Rubin cùng lúc thiết kế lại 6 chip, tất cả đều bước vào giai đoạn sản xuất hàng loạt.

6 chip này gồm:

  • Vera CPU: 88 nhân Olympus, 176 luồng song song, 2270 tỷ bóng bán dẫn trên một chip
  • Rubin GPU: Hiệu năng suy luận đạt 50 PFLOPS (gấp 5 lần Blackwell tiền nhiệm), 3360 tỷ bóng bán dẫn
  • Card mạng ConnectX-9: Ethernet 800Gbps, hỗ trợ tăng tốc RDMA có thể lập trình
  • BlueField-4 DPU: Thiết kế riêng cho nền tảng lưu trữ AI thế hệ mới, 1260 tỷ bóng bán dẫn
  • Chíp chuyển đổi NVLink-6: Kết nối 18 nút tính toán, phối hợp 72 Rubin GPU
  • Chíp chuyển mạch quang học Spectrum-6: 512 kênh 200Gbps, 3520 tỷ bóng bán dẫn

Chỉ nhìn vào các tham số có thể khá khô khan, nhưng số liệu then chốt là thế này — huấn luyện một mô hình 100 nghìn tỷ tham số chỉ cần 1/4 hệ thống Blackwell. Chi phí tạo ra một token giảm xuống còn một phần mười.

Đằng sau việc nâng cao mật độ tính toán: cuộc cách mạng kỹ thuật

Trước đây, xây dựng một nút siêu máy tính cần 43 dây cáp, lắp ráp mất 2 giờ và dễ xảy ra lỗi. Nút Vera Rubin không có dây kết nối điện nào, chỉ cần 6 ống nước làm mát — thời gian lắp đặt rút ngắn còn 5 phút.

Phía sau tủ máy có gần 3.2 km cáp đồng, 5.000 dây tạo thành mạng backbone NVLink, cung cấp băng thông 400Gbps. Jensen Huang đùa rằng: “Chỉ những CEO khỏe mạnh mới có thể di chuyển được thứ này.”

Quan trọng hơn là nâng cấp bộ nhớ — hệ thống NVL72 có 54TB bộ nhớ LPDDR5X (gấp 3 lần thế hệ trước) và 20.7TB HBM, băng thông HBM4 đạt 1.6 PB/s. Dù hiệu năng tăng 3.5-5 lần, số bóng bán dẫn chỉ tăng 1.7 lần, phản ánh tiến bộ trong công nghệ bán dẫn.

Giải quyết “vấn đề đuôi dài”: từ năng lực đến ứng dụng

Trong huấn luyện AI luôn tồn tại một điểm nghẽn — khả năng ghi nhớ ngữ cảnh hạn chế. Các mô hình lớn khi hoạt động sẽ tạo ra “KV Cache” (bộ nhớ khóa-giá trị), đó là “bộ nhớ làm việc” của AI. Khi cuộc đối thoại kéo dài, mô hình lớn hơn, dung lượng HBM thường không đủ.

Giải pháp của Vera Rubin là triển khai bộ xử lý BlueField-4 trong tủ máy để quản lý KV cache. Mỗi nút có 4 BlueField-4, mỗi cái cung cấp 150TB bộ nhớ ngữ cảnh — sau khi phân bổ cho GPU, mỗi GPU còn thêm 16TB bộ nhớ (tổng thể GPU khoảng 1TB), tốc độ truyền vẫn giữ ở 200Gbps, không gây nghẽn hiệu năng.

Để các “ghi chú” này phân tán trên hàng chục tủ, hàng nghìn GPU hoạt động như một bộ nhớ thống nhất, mạng phải đủ lớn, đủ nhanh, đủ ổn định. Đó là lý do Spectrum-X ra đời — nền tảng Ethernet dành riêng cho AI sinh dạng, tích hợp công nghệ quang tử của TSMC, 512 kênh × 200Gbps.

Jensen Huang tính toán: trung tâm dữ liệu 1GW có chi phí 50 tỷ USD, Spectrum-X có thể tăng throughput 25%, tiết kiệm 50 tỷ USD. “Bạn có thể nói hệ thống mạng này gần như miễn phí.”

“Mở nguồn gây chấn động” và chuyển hướng ngành

Quay lại phần mở đầu, Jensen Huang đưa ra một con số — 100 nghìn tỷ đô la tài nguyên tính toán đã đầu tư trong 10 năm qua đang được nâng cấp toàn diện. Nhưng điều này không chỉ là cập nhật phần cứng, mà còn là bước chuyển trong mô hình lập trình.

Năm ngoái, đột phá mở nguồn của DeepSeek V1 khiến mọi người đều bất ngờ. Là hệ thống suy luận mã nguồn mở đầu tiên, nó đã tạo ra làn sóng phát triển trong ngành. Kimi K2 và DeepSeek V3.2 của Trung Quốc lần lượt đứng đầu bảng xếp hạng mô hình mã nguồn mở hiện nay.

Jensen Huang thừa nhận, mặc dù các mô hình mở nguồn có thể chậm hơn các mô hình hàng đầu của ngành khoảng 6 tháng, nhưng cứ mỗi nửa năm lại có mô hình mới ra đời. Tốc độ này khiến các startup, tập đoàn lớn, viện nghiên cứu đều không muốn tụt lại — NVIDIA cũng không ngoại lệ. Vì vậy, lần này họ không chỉ “bán cuốc”, mà còn đầu tư hàng tỷ USD vào siêu máy tính DGX Cloud, phát triển các mô hình như La Proteina (tổng hợp protein) và OpenFold 3.

Gia đình mô hình mã nguồn mở Nemotron bao gồm các hướng như nhận diện giọng nói, đa mô thức, RAG, an ninh, đang thể hiện tốt trong nhiều bảng xếp hạng, ngày càng nhiều doanh nghiệp triển khai chúng.

Ba tầng máy tính của AI vật lý

Nếu các mô hình ngôn ngữ lớn giải quyết được vấn đề “thế giới số”, thì tham vọng tiếp theo là chinh phục “thế giới vật lý”. Để AI hiểu các quy luật vật lý, tồn tại trong thực tế, cần dữ liệu cực kỳ hiếm có.

Jensen Huang tóm tắt “ba chiếc máy tính” cần thiết cho AI vật lý:

  1. Máy tính huấn luyện — hệ thống hiệu năng cao chứa thẻ huấn luyện (như kiến trúc GB300)
  2. Máy tính suy luận — “não nhỏ” tích hợp trong robot và ô tô, chịu trách nhiệm quyết định và thực thi theo thời gian thực
  3. Máy tính mô phỏng — gồm Omniverse và Cosmos, cho phép AI học tập và phản hồi trong môi trường ảo

Hệ thống Cosmos có thể tạo ra hàng loạt môi trường huấn luyện vật lý cho AI. Dựa trên kiến trúc này, Jensen Huang chính thức ra mắt mô hình lái xe tự động toàn diện đầu tiên thế giới — Alpamayo.

Khác với hệ thống truyền thống, Alpamayo là mô hình huấn luyện toàn diện thực sự. Đột phá của nó là giải quyết “vấn đề đuôi dài” của tự động lái — khi đối mặt với các tình huống lạ, phức tạp trên đường, Alpamayo không cứng nhắc thực thi mã, mà suy luận như con người. “Nó sẽ cho bạn biết tiếp theo nên làm gì, và tại sao lại như vậy.” Trong demo, chiếc xe vận hành tự nhiên, mượt mà, phân tích các tình huống phức tạp thành các quy tắc cơ bản.

Đã có xe Mercedes CLA trang bị công nghệ Alpamayo sẽ ra mắt tại Mỹ trong quý 1 năm nay, sau đó mở rộng sang châu Âu và châu Á. Chiếc xe này được NCAP xếp hạng là ô tô an toàn nhất thế giới, nhờ thiết kế “hai lớp an toàn” độc đáo của NVIDIA — khi AI toàn diện không chắc chắn, hệ thống tự động chuyển sang chế độ truyền thống an toàn hơn.

Đội quân robot và nhà máy thành robot

Chiến lược robot của NVIDIA cũng rất lớn lao. Tất cả robot sẽ trang bị máy tính nhỏ Jetson, huấn luyện trong mô phỏng Isaac của Omniverse. Các công nghệ này được tích hợp vào hệ sinh thái công nghiệp của Synopsys, Cadence, Siemens và các hãng khác.

Trên sân khấu xuất hiện robot người của Boston Dynamics và Agility, robot bốn chân, cùng robot của Disney. Jensen Huang đùa rằng: “Những chú robot dễ thương này sẽ được thiết kế, chế tạo, thậm chí thử nghiệm trong máy tính, trước khi tiếp xúc trọng lực thực sự, chúng đã ‘sống’ một lần rồi.”

Mục tiêu cuối cùng của NVIDIA là dùng AI vật lý để tăng tốc toàn bộ từ thiết kế chip nền tảng, kiến trúc hệ thống đến mô phỏng nhà máy — bao gồm cả việc mở rộng sang các khu vực mới, các ứng dụng mới, như xây dựng bản đồ thử nghiệm vật lý (mapa fizyczna azji) để kiểm tra hiệu suất của tự động lái và robot trong các điều kiện địa lý khác nhau.

Logic “bán vũ khí trong thời chiến”

Nếu không phải Jensen Huang, bạn có thể nghĩ đây là buổi ra mắt của một công ty mô hình AI nào đó. Khi bong bóng AI tăng nhiệt, quy luật Moore chậm lại, Jensen Huang dường như muốn thổi lại niềm tin của chúng ta vào AI — bằng cách trình diễn những gì nó thực sự có thể làm.

Từ nền tảng chip siêu mạnh Vera Rubin, đến nhấn mạnh vào ứng dụng và phần mềm, rồi đến AI vật lý, tự động lái, robot và các ví dụ thực tế — họ từng tạo chip cho thế giới ảo, giờ trực tiếp trình diễn, tập trung vào AI vật lý, cạnh tranh quyết liệt trong thế giới thực.

Dù sao, chỉ có “thời chiến”, vũ khí mới tiếp tục bán chạy.


Easter Egg: Do hạn chế thời gian tại CES, Jensen Huang chưa trình bày hết tất cả các slide. Phần chưa trình chiếu đã được làm thành một đoạn phim hài hước.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim