Дженсен Хуанг привіз 2500 кг "монстра", NVIDIA Vera Rubin кардинально змінює індустрію штучного інтелекту

Останній раз NVIDIA на CES не показувала споживчі графічні карти — це було 5 років тому. Але цього разу все інакше — Jensen Huang у характерній шкірянці-касатці вийшов на сцену і приніс вагомий сюрприз: серверний шафа вагою 2,5 тонни та потенційно революційний для індустрії штучного інтелекту обчислювальний платформ Vera Rubin.

Ця система, названу на честь астрономки Вери Рубін (яка відкрила темну матерію), вирішує найактуальнішу проблему епохи AI — потребу у повністю модернізованих обчислювальних ресурсах, що оцінюються у 10 трильйонів доларів.

З одного пристрою — як NVIDIA грає “інтеграцію чіпів”

Коли традиційний закон Мура починає втрачати силу, NVIDIA обрала шлях екстремальної інтеграції. В цей раз вони порушили традицію — замість покращення 1-2 чіпів у кожному поколінні, Vera Rubin одночасно перепроектувала 6 чіпів, і всі вони вже в масовому виробництві.

Ці 6 чіпів:

  • Vera CPU: 88 ядер Olympus, 176 потоків, 2270 мільярдів транзисторів на один чіп
  • Rubin GPU: продуктивність inference до 50 PFLOPS (у 5 разів більше за попередній Blackwell), 3360 мільярдів транзисторів
  • ConnectX-9 мережевий адаптер: 800 Гбіт/с Ethernet, підтримка програмованого RDMA
  • BlueField-4 DPU: спеціально для нових AI-сторедж платформ, 1260 мільярдів транзисторів
  • NVLink-6 комутатор: з’єднує 18 обчислювальних вузлів, 72 Rubin GPU у спільній роботі
  • Spectrum-6 оптичний Ethernet-комутатор: 512 каналів по 200 Гбіт/с, 3520 мільярдів транзисторів

Здається, параметри нудні, але головне — щоб навчити модель з 100 трильйонами параметрів, потрібно лише 1/4 систем Blackwell. Вартість генерації одного токена зменшилася у десять разів.

За лаштунками підвищення щільності обчислень: революція в інженерії

Раніше для побудови суперкомп’ютера потрібно було 43 кабелі, збірка займала 2 години і була схильною до помилок. В Vera Rubin немає жодних електричних кабелів — лише 6 рідинних систем охолодження, монтаж триває всього 5 хвилин.

Ззаду шафи — майже 3,2 км мідних кабелів, 5000 ліній формують ядро NVLink із пропускною здатністю 400 Гбіт/с. Jensen Huang пожартував: “Тільки здоровий CEO зможе підняти цю річ.”

Ще важливіше — оновлення пам’яті: система NVL72 має 54 ТБ LPDDR5X (у 3 рази більше за попередню) і 20,7 ТБ HBM, пропускна здатність HBM4 — 1,6 ПБ/с. Хоча продуктивність зросла у 3,5-5 разів, кількість транзисторів збільшилася лише у 1,7 разу — це свідчить про прогрес у процесі напівпровідникової технології.

Вирішення “довгого хвоста”: від можливостей до застосувань

У тренуванні AI завжди був вузький місць — недостатня пам’ять для контексту. Величезні моделі генерують “KV Cache” — ключі та значення, що є “робочою пам’яттю” AI. З розширенням діалогу та збільшенням моделей обсяг HBM часто виявляється недостатнім.

Рішення Vera Rubin — розміщення у шафі процесорів BlueField-4 для управління KV-кешем. На кожен вузол припадає 4 BlueField-4, кожен з яких забезпечує 150 ТБ контекстної пам’яті — після розподілу на GPU кожен отримує додатково 16 ТБ пам’яті (сам GPU має близько 1 ТБ), швидкість передачі залишається 200 Гбіт/с, і не виникає вузьких місць у продуктивності.

Щоб ці “записки”, розподілені по десятках шаф і тисячах GPU, працювали як єдина пам’ять, мережа має бути достатньо великою, швидкою і стабільною. Саме для цього створено Spectrum-X — першу у світі “Ethernet-платформу для генеративного AI”, з інтеграцією TSMC-кремнієвих фотонних технологій, 512 каналів по 200 Гбіт/с.

Jensen Huang порахував: вартість дата-центру у 1 ГВт — 50 мільярдів доларів, Spectrum-X дає приріст пропускної здатності на 25%, що економить 50 мільйонів доларів. “Можна сказати, що ця мережа майже безкоштовна.”

“Відкритий код — шок для індустрії” та зміщення фокусу

Повертаючись до початку виступу, Jensen Huang назвав цифру — за останні 10 років витрати на обчислювальні ресурси сягнули 10 трильйонів доларів і зараз повністю оновлюються. Але це не лише апгрейд апаратного забезпечення — це й зміна парадигми програмування.

Минулого року відкриття DeepSeek V1 у форматі open source шокувало всіх. Як перша у світі відкрито доступна система для inference, вона викликала хвилю розробок у галузі. Китайські моделі Kimi K2 і DeepSeek V3.2 зараз посідають перше і друге місця у рейтингах open source.

Jensen Huang зізнався, що хоча відкриті моделі можуть бути на 6 місяців відставати від провідних комерційних, кожні півроку з’являється нова модель. Така швидкість ітерацій змушує стартапи, гігантів і дослідницькі інститути не відставати — NVIDIA теж. Тому цього разу вони не просто “продають лопати”, а інвестують у суперкомп’ютери DGX Cloud на сотні мільйонів доларів, розробляють моделі La Proteina (синтез білка) і OpenFold 3.

Відкритий сімейство моделей Nemotron охоплює голос, мультимодальність, RAG, безпеку і показує хороші результати у багатьох рейтингах — дедалі більше компаній їх впроваджують.

Три рівні фізичного AI

Якщо великі мовні моделі вирішили проблему “цифрового світу”, наступна мета — підкорити “фізичний світ”. Щоб AI міг розуміти фізичні закони і виживати у реальності, потрібні дуже рідкісні дані.

Jensen Huang окреслив “три комп’ютери”, необхідні для фізичного AI:

  1. Навчальний комп’ютер — високопродуктивна система з картами для тренування (наприклад, архітектура GB300)
  2. Обчислювальний для inference — “мозок” роботів і автомобілів, що приймає рішення у реальному часі
  3. Моделювальний комп’ютер — з Omniverse і Cosmos, щоб навчати і давати зворотний зв’язок у віртуальному середовищі

Cosmos здатен створювати безліч фізичних сценаріїв для тренування AI. На базі цієї архітектури Jensen Huang офіційно представив першу у світі повністю автоматизовану модель для автономного водіння — Alpamayo.

На відміну від традиційних систем, Alpamayo — справжня end-to-end модель. Вона вирішує проблему “довгого хвоста” — у незнайомих і складних ситуаціях на дорозі вона не просто виконує заздалегідь написаний код, а робить логічні висновки, як людина. “Вона підкаже, що робити далі і чому саме так.” У демонстрації автомобіль їхав природно і плавно, розбиваючи складні ситуації на базові правила.

Вже реалізовано — Mercedes CLA з Alpamayo буде представлений у США у першому кварталі, а потім у Європі та Азії. Цей автомобіль визнаний NCAP найбезпечнішим у світі завдяки унікальній “подвійній системі безпеки” NVIDIA — коли AI не впевнений, система автоматично переходить у більш надійний клас традиційних систем.

Роботизована армія і фабрики — як робототехніка

Стратегія NVIDIA щодо робототехніки також масштабна. Усі роботи матимуть Jetson — міні-комп’ютер для тренувань у симуляторі Isaac у Omniverse. Ці технології інтегровані у промислові екосистеми, такі як Synopsys, Cadence, Siemens.

На сцені з’явилися гуманоїдні роботи Boston Dynamics і Agility, а також роботи Disney. Jensen Huang пожартував: “Ці милі створіння будуть проектуватися, виготовлятися і тестуватися у комп’ютері, і перед тим, як опинитися під реальним гравітаційним навантаженням, вони вже “жили” у віртуальності.”

Мета NVIDIA — прискорити все: від базового дизайну чіпів до системної архітектури і фабричного моделювання — за допомогою фізичного AI. Це включає створення нових регіонів і застосувань, наприклад, у Азії з’явилася фізична карта (mapa fizyczna azji), що використовується для тестування автономного водіння і робототехніки у різних географічних умовах.

Логіка “продажу зброї у часи війни”

Якщо б не Jensen Huang, можна було б подумати, що це презентація якогось AI-модельного стартапу. Коли тема бульбашки AI і повільний закон Мура починають набирати обертів, Jensen Huang ніби прагне знову вселити нам довіру до AI — показуючи, що він реально може.

Від надмогутніх платформ Vera Rubin до акценту на застосування і софтверу, від фізичного AI і автономного водіння до робототехніки — вони не просто створюють чіпи для віртуального світу, а й демонструють у реальності, у фізичному світі, активну конкуренцію.

Адже “у часи війни” зброя має продаватися.


Підказка: через обмеження CES Jensen Huang не закінчив усі слайди. Невикористані частини зібрано у гумористичний короткий ролик.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити