Гипер: Почему локальная обработка ИИ скоро изменит индустрию

Переход от облачных вычислений к периферийным

Облачный ИИ-инференс стал чрезмерно дорогим. Несмотря на значительное снижение стоимости токенов — данные Стэнфорда показывают, что модели, эквивалентные GPT-3.5, за два года подешевели в 280 раз — предприятия все еще сталкиваются с растущими затратами на ИИ-рабочие нагрузки. Проблема усугубляется при работе с продвинутыми моделями рассуждений и ИИ-агентами, которые требуют гораздо больше токенов, чем простые задачи инференса.

Это создает возможность. По мере повышения эффективности моделей ИИ и улучшения аппаратного обеспечения обработка определенных нагрузок локально на личных устройствах начинает иметь экономический смысл. Рамочная концепция, предложенная Deloitte, выделяет три различных сценария развертывания: гиперскалеры облака обрабатывают сложные, экспериментальные нагрузки, требующие моделей высшего уровня; локальная инфраструктура обслуживает предсказуемые, чувствительные нагрузки, где важна задержка; а периферийные устройства, включая персональные компьютеры, обеспечивают работу в реальном времени с меньшими моделями.

Ключевое понимание? Мы вступаем в эпоху, когда распределенная обработка ИИ становится неизбежной.

Ответ AMD: платформа Ryzen AI Halo

На CES AMD представила продукт, который заслуживает гораздо большего внимания, чем привлекающие внимание GPU MI440X: Ryzen AI Halo. Запуск запланирован на Q2, этот мини-ПК символизирует важное позиционирование на следующий цикл вычислений.

Характеристики рассказывают свою историю:

  • 16-ядерная архитектура CPU
  • 128 ГБ объединенной памяти
  • Встроенный ИИ-процессор с графическим сопроцессором
  • Общая вычислительная мощность ИИ: до 126 TOPS (триллионов операций в секунду)

Это не ориентировано на массового потребителя. Это платформа для разработчиков, предназначенная для инженеров, создающих ИИ-приложения локально. Объем памяти в 128 ГБ позволяет запускать крупные модели с открытым исходным кодом — например, модели с миллиардами параметров — прямо на устройстве. Хотя эти модели не конкурируют с передовыми моделями OpenAI или Anthropic, они достаточно мощные для сложных реальных задач.

Почему этот продукт важен для будущего AMD

Вероятно, Ryzen AI Halo не достигнет массовых продаж. Он дорогой, специализированный и нишевый по определению. Но он сигнализирует о чем-то важном в стратегическом мышлении AMD.

Более широкая линейка ПК с ИИ уже поставляется с значимыми возможностями. Ryzen AI 400 серии обеспечивает 60 TOPS и начала поставляться в этом месяце, в то время как процессоры Ryzen AI Max+ в Halo поддерживают полную конфигурацию памяти в 128 ГБ и могут выполнять модели с 128 миллиардами параметров.

Современные ПК с ИИ сталкиваются с серьезными ограничениями. Производительности недостаточно, доступной памяти слишком мало, а проблемы с поставками памяти остаются. Но это временные препятствия, а не постоянные ограничения.

Неизбежное слияние

Рассмотрим помощников по коду, таких как Claude Code, которые уже преобразили рабочие процессы программирования. Насколько далеко от нас ноутбук с ИИ-моделью сопоставимой сложности? Три года? Четыре? Траектория движется в одном направлении.

Локальный запуск ИИ-инференса исключает постоянные расходы на облачные API, сохраняет конфиденциальность данных на устройстве и сокращает задержки до почти нуля. Эти преимущества накапливаются. Одновременно запрос устройства к удаленным сервисам для выполнения задач, которые оно может решить самостоятельно, со временем станет казаться неэффективным.

Позиционирование на рынке будущего

AMD уже не конкурирует только с Nvidia в дата-центрах. Компания готовится к новой парадигме вычислений, где интеллектуальная обработка происходит ближе к пользователю, где персональные устройства становятся мощными платформами ИИ, и где ее важная роль в этом переходе становится все более очевидной.

Ryzen AI Halo сегодня — нишевый продукт. Завтра мощные локальные ИИ-процессоры не будут таковыми. AMD закладывает фундамент сейчас, чтобы, когда наступит этот сдвиг, занять лидирующие позиции и захватить ценность на различных уровнях развивающейся экосистемы ИИ.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить