🚨 КРИЗА ОЗУ ЩЕ НЕ ЗАКІНЧИЛАСЯ, А АЛГОРИТМ ЇЇ ВИРІШИВ


У жовтні 2025 року OpenAI полетіли до Сеулу.
Вони підписали угоди з Samsung і SK Hynix.
На 900 000 пам’ятних пластин. Щомісяця.
Це 40% від усього світового запасу DRAM.
Заброньовано. Для однієї компанії.
Набір DDR5 RAM зросли з $120 до $490 майже за ніч.
Ноутбуки стали дорожчими.
Телефони поставлялися з меншим обсягом RAM.
Конструктори ПК платили у 4 рази більше, ніж рік тому.
Аналітики назвали це найгіршою кризою пам’яті за 20 років.
Потім Google опублікували дослідницький документ.
Ось чому це важливо.
Кожен AI-чатбот, яким ви користуєтеся, має «робочу пам’ять».
Її називають кеш KV.
Саме так модель запам’ятовує вашу розмову під час спілкування.
Вона зберігається з точністю 16 біт.
Це як писати кожне слово великими жирними літерами.
Вона точна. Але величезна.
І коли контекстні вікна AI зросли до 1 мільйона токенів, ця пам’ять роздулася.
Центри обробки даних запасали RAM просто щоб не відставати.
Команда Google поставила інше питання.
Чи справді вона має бути такою великою?
Відповідь була ні.
Вони розробили TurboQuant.
За допомогою полярної координатної математики та трансформу Johnson-Lindenstrauss, вони зменшили цю пам’ять з 16 біт до 3.
Не потрібно повторне навчання.
Жодної втрати точності.
В 6 разів менше пам’яті.
В 8 разів швидше на Nvidia H100.
Документ з’явився 25 березня 2026 року.
Акції чипів пам’яті впали протягом 24 годин.
А потім сталося ще щось.
OpenAI вже перебували під тиском.
Інвестори вимагали скорочення витрат.
Можливий IPO був на горизонті.
Вони скасували велике угоду з Oracle у Техасі.
Вони закрили Sora.
Тихо скоригували свої замовлення RAM у Samsung і SK Hynix.
Кити DDR5 знизилися з $100 за кілька тижнів.
Криза з пам’яттю почала розвиватися майже за ніч.
Ось справжній урок.
Недолік був не в апаратному забезпеченні.
Це була ставка.
Ставка на те, що AI завжди буде пам’яттєзалежним.
Що єдиним рішенням було купувати більше чипів.
TurboQuant скасував цю ставку на рівні програмного забезпечення.
Безкоштовно.
Один дослідницький документ змінив економіку цілого індустрії.
Ось як виглядає алгоритмічна ефективність як макро-сила.
І ми лише починаємо.
Переглянути оригінал
post-image
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити