Дженсен Хуанг приехал с 2500 килограммами "монстра", NVIDIA Vera Rubin полностью обновляет индустрию ИИ

Последний раз NVIDIA не показывала потребительские видеокарты на CES — это было 5 лет назад. Но в этот раз всё было иначе — Jensen Huang вышел на сцену в фирменной кожаной куртке крокодилового цвета и принёс нечто важное: серверный шкаф весом 2,5 тонны и вычислительную платформу Vera Rubin, которая может кардинально изменить всю индустрию AI.

Эта система, названная в честь астронома Веры Рубин (она обнаружила тёмную материю), решает самую актуальную проблему эпохи AI — необходимость полной модернизации вычислительных ресурсов, оцениваемых в 10 триллионов долларов.

Как одна машина показывает, как NVIDIA играет в “интеграцию чипов”

Когда традиционный закон Мура постепенно теряет силу, NVIDIA выбрала путь экстремальной интеграции. В этот раз они нарушили традицию — вместо улучшения 1-2 чипов в поколении, Vera Rubin одновременно переосмыслила 6 чипов, и все они уже запущены в массовое производство.

Эти 6 чипов:

  • Vera CPU: 88 ядер Olympus, 176 потоков, 2270 миллиардов транзисторов на один чип
  • Rubin GPU: производительность inference достигает 50 PFLOPS (в 5 раз больше предыдущего Blackwell), 336 миллиардов транзисторов
  • ConnectX-9 сетевой адаптер: 800 Гбит/с Ethernet, поддержка программируемого RDMA
  • BlueField-4 DPU: специально для следующего поколения AI-хранилищ, 126 миллиардов транзисторов
  • NVLink-6 коммутатор: соединяет 18 вычислительных узлов, 72 Rubin GPU в совместной работе
  • Spectrum-6 оптический Ethernet-коммутатор: 512 каналов по 200 Гбит/с, 352 миллиарда транзисторов

Один только набор параметров может показаться скучным, но главное — цифры такие: для обучения модели с 100 трлн параметров требуется всего четверть системы Blackwell. Стоимость генерации одного токена снизилась в 10 раз.

За кулисами повышения плотности: революция в инженерии

Раньше для сборки суперкомпьютера требовалось 43 кабеля, сборка занимала 2 часа и была подвержена ошибкам. В узлах Vera Rubin нет никаких электропроводов — только 6 жидкостных охлаждающих труб, монтаж занимает всего 5 минут.

На задней панели шкафа проложено почти 3,2 км медных кабелей, 5000 линий образуют ядро NVLink с пропускной способностью 400 Гбит/с. Jensen Huang шутит: «Только здоровый CEO сможет поднять такую штуку.»

Но ещё важнее — апгрейд памяти: система NVL72 содержит 54 ТБ LPDDR5X (в 3 раза больше предыдущей) и 20,7 ТБ HBM, пропускная способность HBM4 достигает 1,6 ПБ/с. Несмотря на рост производительности в 3,5-5 раз, число транзисторов увеличилось всего в 1,7 раза — это свидетельство прогресса в полупроводниковой технологии.

Решение “проблемы длинного хвоста”: от возможностей к приложениям

В обучении AI всегда была проблема — недостаточная контекстная память. Большие модели создают “KV Cache” (ключ-значение кэш), которая служит “рабочей памятью” AI. С увеличением диалога и ростом модели объём HBM часто оказывается недостаточным.

Решение Vera Rubin — установка внутри шкафов процессоров BlueField-4 для управления KV-кешем. В каждом узле по 4 BlueField-4, каждый из которых обеспечивает 150 ТБ контекстной памяти — после распределения на GPU каждый GPU получает дополнительно 16 ТБ памяти (сам GPU — около 1 ТБ), скорость передачи остаётся 200 Гбит/с, не возникает узких мест по производительности.

Чтобы эти “заметки”, разбросанные по десяткам шкафов и тысячам GPU, работали как единая память, сеть должна быть достаточно большой, быстрой и стабильной. В этом помогает Spectrum-X — первый в мире “Ethernet-платформа для генеративного AI”, объединяющая TSMC-совместимую фотонную технологию, 512 каналов по 200 Гбит/с.

Jensen Huang подсчитал: стоимость дата-центра мощностью 1 ГВт — 50 миллиардов долларов, Spectrum-X даст прирост пропускной способности на 25%, что сэкономит 50 миллиардов долларов. «Можно сказать, что эта сетевая система практически бесплатна.»

“Открытое исходное” и смена индустриальной парадигмы

Возвращаясь к началу выступления, Jensen Huang назвал цифру — за последние десять лет вложено 10 триллионов долларов в вычислительные ресурсы, и всё это сейчас полностью обновляется. Но речь идёт не только о железе — меняется парадигма программирования.

В прошлом году открытие DeepSeek V1 потрясло всех. Как первая открытая система для inference, оно вызвало волну разработок по всему миру. Китайские модели Kimi K2 и DeepSeek V3.2 сейчас занимают 1 и 2 места в рейтингах открытых моделей.

Jensen Huang признаёт, что хотя открытые модели могут отставать от лидеров индустрии примерно на 6 месяцев, каждые полгода появляется новая модель. Такая скорость итераций заставляет стартапы, гигантов и исследовательские институты не отставать — NVIDIA тоже. Поэтому они не только “продают лопаты”, но и инвестируют сотни миллионов долларов в облачные суперкомпьютеры DGX Cloud, разрабатывают модели La Proteina (синтез белка) и OpenFold 3.

Семейство открытых моделей Nemotron включает решения для речи, мультимодальности, RAG, безопасности и показывает хорошие результаты в различных рейтингах — всё больше компаний внедряют их.

Три уровня вычислений физического AI

Если большие языковые модели решают проблему “цифрового мира”, следующий шаг — покорение “физического мира”. Для этого AI нужно понять законы физики и уметь жить в реальности, что требует очень редких данных.

Jensen Huang выделил “три компьютера”, необходимые для физического AI:

  1. Обучающий компьютер — высокопроизводительная система с картами обучения (например, архитектура GB300)
  2. Инференционный компьютер — “мозг” роботов и автомобилей, отвечающий за реальное принятие решений
  3. Моделирующий компьютер — включает Omniverse и Cosmos, позволяя AI учиться и получать обратную связь в виртуальной среде

Cosmos создаёт для AI огромные физические миры для обучения. На базе этой архитектуры Jensen Huang анонсировал первый в мире полностью автоматизированный модель для автономного вождения — Alpamayo.

В отличие от традиционных систем, Alpamayo — это действительно end-to-end обучение. Его прорыв — решение “проблемы длинного хвоста” в автоматическом вождении: при столкновении с незнакомыми сложными ситуациями он не просто выполняет жесткий код, а делает выводы, как человек. “Он скажет вам, что делать дальше и почему.” В демонстрации машина вела себя естественно и плавно, разбивая сложные ситуации на базовые правила.

Уже реализовано — Mercedes CLA с Alpamayo в первом квартале этого года выйдет в США, затем в Европу и Азию. Эта модель признана NCAP самой безопасной машиной в мире благодаря уникальной системе двойной безопасности NVIDIA — когда AI не уверен, система автоматически переключается на более надёжный классический режим.

Роботный десант и фабрики как роботы

Стратегия NVIDIA в области роботов тоже масштабна. Все роботы будут оснащены мини-компьютерами Jetson, обучаться в симуляторе Isaac в Omniverse. Эти технологии интегрированы в индустриальные экосистемы таких компаний, как Synopsys, Cadence, Siemens.

На сцене появились гуманоиды Boston Dynamics и Agility, четырёхногие роботы, а также роботы Disney. Jensen Huang шутит: “Эти милые ребята будут проектироваться, производиться и тестироваться в компьютере, и перед тем, как попасть под реальную гравитацию, уже “проживут” свою жизнь.”

Видение NVIDIA — от проектирования чипов и системной архитектуры до моделирования фабрик — всё ускоряется с помощью физического AI. В том числе для новых регионов и приложений: например, создана карта физического мира (mapa fizyczna azji), которая помогает проверять работу автоматического вождения и роботов в разных условиях.

Логика “продажи оружия во время войны”

Если бы не Jensen Huang, можно было подумать, что это презентация какого-то AI-модульного стартапа. Когда тема пузыря AI и замедление закона Мура набирают обороты, Jensen Huang, кажется, хочет вновь вселить уверенность в AI — показывая, что он реально умеет.

От мощных платформ Vera Rubin до акцента на приложения и софта, от физического AI и автономных машин до роботов — раньше они делали чипы для виртуального мира, а сейчас лично демонстрируют их работу, делая ставку на физический AI и активную конкуренцию в реальном мире.

Ведь только “военное время” позволяет продолжать активно продавать оружие.


Пасхалка: из-за ограничений по времени на CES Jensen Huang не успел показать все слайды. Не показанные части были сделаны в виде юмористического короткометражного фильма.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить