У сучасну епоху стрімкого технологічного розвитку ChatGPT від OpenAI, безсумнівно, став яскравою зіркою у сфері штучного інтелекту. Однак зі сплеском числа його користувачів поступово спливла на поверхню проблема, яку не можна ігнорувати - дефіцит обчислювальних потужностей. Це не просто виклик для OpenAI, а проблема для всієї індустрії штучного інтелекту.
У цьому поглибленому аналізі ми розглянемо основні причини нестачі обчислювальних потужностей і те, як це впливає на розробку великих моделей і майбутнє галузі. У той же час ми також вивчимо потенційні шляхи вирішення цієї проблеми, включаючи розробку вітчизняних графічних процесорів та їх можливий вплив на світовий ринок.
Дефіцит обчислювальних потужностей завжди був гострою проблемою, з якою доводиться стикатися OpenAI у своєму швидкому зростанні. Останнім часом це питання стало більш актуальним через резонансний інцидент. Компанія OpenAI провела масштабний виставковий захід під назвою «Гала-концерт весняного фестивалю науки і технологій», продемонструвавши останні досягнення своєї технології, яка привернула велику увагу в усьому світі. У результаті потік користувачів стікався на платформу OpenAI, особливо на її зірковий продукт ChatGPT.
Однак за цим захопленням стоїть величезний виклик. Вибухове зростання кількості користувачів швидко перевищило обчислювальні потужності OpenAI. Буквально через два дні після конференції з'ясувався шокуючий факт: сервер ChatGPT вийшов з ладу. Незліченна кількість користувачів мережі повідомили, що вони не можуть нормально використовувати API, надані ChatGPT та OpenAI.
Зіткнувшись із цією кризою, OpenAI довелося прийняти рішення, яке шокувало ринок: призупинити реєстрацію нових користувачів ChatGPT Plus. Економічні витрати, що стоять за цим рішенням, величезні: 100 мільйонів нових користувачів приносять OpenAI 2 мільярди доларів доходу на місяць при щомісячній абонентській платі в розмірі 20 доларів. Така величезна потенційна вигода, але від необхідності відмовитися через дефіцит обчислювальних потужностей, безсумнівно, є вкрай пасивним вибором.
Насправді дефіцит обчислювальних потужностей – це не просто недавнє явище. З моменту запуску ChatGPT питання обчислювальної потужності залишилося в тіні. Наприклад, у квітні ChatGPT Plus також був змушений призупинити закупівлю платних товарів. Це трапляється час від часу, і, схоже, це стало нормою на шляху зростання OpenAI.
Ці події розкривають незаперечний факт: у контексті сучасного технологічного розвитку обчислювальні потужності стали основним вузьким місцем, що обмежує інновації в технологіях штучного інтелекту та розширення комерційних застосувань. Для OpenAI це не лише технічний виклик, а й стратегічний. Як знайти баланс між ринковим попитом, що стрімко зростає, і обмеженими обчислювальними ресурсами стало складною проблемою для OpenAI. Цей виклик стосується не лише короткострокових прибутків компанії, а й її довгострокової позиції на ринку та технологічного лідерства.
Сім'я поміщика не має надлишків зерна
OpenAI неодноразово заявляла, що обчислювальних потужностей недостатньо.
Ви повинні знати, що OpenAI — це зіркове підприємство з великими моделями, з величезним фінансуванням і великою кількістю обчислювальних ресурсів. Більш того, є ще й «золотий батько» Microsoft, який надає повний спектр підтримки обчислювальних потужностей. Корпорація Майкрософт має другі за величиною ресурси хмарних обчислень у світі.
З цієї точки зору OpenAI можна назвати «господарем» обчислювальних потужностей. Але реальність така, що сім'я орендодавця не має надлишків їжі. Так чому ж компанія з величезним фінансуванням і сильною підтримкою, така як Microsoft, потрапила в таке скрутне становище?
Треба визнати, що попит на обчислювальні потужності для великих моделей безпрецедентний. Ці моделі засновані на сотнях мільярдів нейронних мереж, і кожне обчислення є величезним випробуванням обчислювальної потужності. Простіше кажучи, зараз ми зіткнулися з абсолютно новим рівнем обчислювальних потреб, яким не було рівних в історії розробки програмного забезпечення. Традиційних обчислювальних ресурсів, таких як центральні процесори, тут недостатньо, а графічний процесор, на який потрібно покладатися, безсумнівно, є передовою лінією цієї технологічної революції.
Проблема з графічними процесорами, однак, полягає в тому, що вони є не тільки новими технологічними продуктами, але й стикаються з подвійними проблемами, пов'язаними з ітерацією дизайну та обмеженнями потужності. Незважаючи на зростаючий попит на графічні процесори у світі технологій, світові виробничі потужності з виробництва мікросхем не встигають за ними. Існуючі системи виробництва, упаковки та тестування напівпровідників в основному розроблені навколо процесорів, і для нових графічних процесорів вони, очевидно, не повністю адаптовані. Це означає, що попереду ще довгий шлях з точки зору збільшення потужності графічного процесора та адаптації до нових технологічних потреб.
Технологія GPU продовжує розвиватися, з кожним новим поколінням прагне підвищити продуктивність та ефективність, що вимагає постійних інвестицій у дослідження та розробки та технологічних інновацій. Однак ця безперервна ітерація технології також означає збільшення витрат на НДДКР, а також збільшення складності виробничого процесу.
Окрім питання виробничих потужностей, вартість графічних процесорів також є питанням, яке не можна ігнорувати. Щоб побудувати обчислювальний кластер GPU, який може підтримувати великомасштабні модельні обчислення, потрібні не тільки технології, а й величезні капіталовкладення. Навіть для такого технологічного гіганта, як OpenAI, це значне навантаження. Знайти баланс між витратами та вигодою – складний вибір.
Якщо навіть OpenAI бореться з нестачею обчислювальних потужностей, що буде з іншими компаніями? Це виклик не лише для OpenAI, а й для всієї індустрії штучного інтелекту. Те, що ми спостерігаємо, є величезним зрушенням: перехід від традиційних обчислень до обчислень на основі штучного інтелекту. У цій трансформації обчислювальні потужності стали найважливішим вузьким місцем.
Не можна ігнорувати той факт, що цей дефіцит стався не відразу, а є результатом невідповідності між довгостроковими технологічними розробками та ринковим попитом. Виробничі обмеження, технологічний розвиток і питання вартості чіпів GPU є багатогранними, включаючи глобальні ланцюжки поставок, технологічні інновації та економічні моделі. Високі вимоги до обчислювальної потужності великих модельних додатків створюють безпрецедентні проблеми для існуючих технологічних архітектур, змушуючи всю галузь переосмислити способи проектування, створення та оптимізації обчислювальних ресурсів.
Коли B-end додаток буде масштабовано, проблема нестачі обчислювальної потужності буде серйознішою
Є ще одне питання, яке дуже важливе, але його легко не помітити.
Коли ми говоримо про нестачу обчислювальних потужностей, ми зазвичай зосереджуємося на поточному користувацькому досвіді на стороні C. Однак це лише верхівка айсберга. Ще більш серйозна, але часто ігнорована проблема ховається в масштабі додатків на стороні Б. На даний момент, хоча великі моделі, такі як ChatGPT, в основному обслуговують користувачів C-end, це лише початок. З поступовим зростанням і зрілістю додатків B-end ми зіткнемося з безпрецедентним сплеском попиту на обчислювальні потужності.
На китайському ринку ця тенденція вже починає зароджуватися. Незважаючи на те, що такі продукти, як Baidu Wenxin Yiyan і Ali Tongyi Qianwen, в даний час в основному обслуговують користувачів C-end, їх дослідження додатків B-end вже в дорозі. В даний час більшість цих продуктів знаходяться на стадії розробки продукту, але як тільки вони перейдуть в масштабну комерційну стадію, ситуація буде зовсім іншою. Складність бізнесу на стороні Б набагато більша, ніж на стороні С. На стороні C взаємодія користувача з системою зазвичай така ж проста, як виконання запиту або команди. Однак, на стороні Б, кожен бізнес-процес може включати більш складні процеси обробки, аналізу та прийняття рішень. Ці процеси не тільки вимагають більше обчислювальних ресурсів, але і пред'являють більш високі вимоги до якості і стабільності обчислювальних потужностей.
Що ще примітно, так це те, що обчислювальна потужність B-end сервісів відбивається не тільки на складності одиничної взаємодії, але і на частоті дзвінків. На стороні Б застосування великих моделей має тенденцію бути безперервним і високочастотним, на відміну від випадкових запитів і використання на стороні С. Наприклад, у таких галузях, як фінанси, охорона здоров'я та виробництво, великі моделі повинні безперервно обробляти великі обсяги даних, щоб забезпечити аналіз у режимі реального часу та підтримку прийняття рішень. Такий попит на високочастотні високонавантажені обчислення чинить величезний тиск на обчислювальні потужності.
Можна передбачити, що з популяризацією великих моделей на стороні B її потреба в обчислювальній потужності швидко перевищить потребу в C-стороні. Цей зсув може бути незначним, але його вплив далекосяжний. З одного боку, підвищений попит на обчислювальні потужності стимулюватиме розвиток суміжних технологій, таких як більш ефективні графічні процесори та більш оптимізовані обчислювальні архітектури. З іншого боку, це також матиме значний вплив на розподіл ресурсів, структуру витрат та бізнес-модель галузі в цілому.
У процесі ми можемо побачити, як деякі компанії будуть змушені піти з ринку, тому що вони не можуть дозволити собі такі витрати на обчислювальну потужність, або ми можемо побачити, як деякі компанії виділяються передовими технологіями управління обчислювальними потужностями та оптимізації.
Китай зіткнувся з подвійним вузьким місцем обчислювальної потужності
У глобальному масштабі дефіцит обчислювальних потужностей став основним вузьким місцем у розвитку штучного інтелекту, і для Китаю ця проблема є особливо серйозною. Великомасштабним модельним компаніям Китаю доводиться мати справу не тільки з глобальним дефіцитом обчислювальних потужностей («стихійні лиха»), але й з унікальними обмеженнями ринкової пропозиції («техногенні катастрофи»), що робить перспективи розвитку Китаю в галузі великих моделей складними та складними.
Ми повинні визнати обмеженість великомасштабних зразкових підприємств Китаю в обчислювальних ресурсах. Хоча такі компанії, як Baidu, Alibaba, ByteDance, Tencent і Huawei, досягли значних успіхів у розробці великих моделей, обчислювальні проблеми, з якими вони стикаються, є реальними та нагальними. В даний час через загальний недостатній розвиток світової індустрії GPU китайські підприємства зіткнулися з серйозними перешкодами в отриманні достатньої кількості обчислювальних ресурсів. Такого роду проблеми типу «стихійного лиха» є єдиним шляхом для технологічного розвитку та модернізації промисловості, і для їх вирішення потрібен час і величезні інвестиції.
Що ще складніше, так це те, що великомасштабні модельні компанії Китаю також стикаються з «техногенними катастрофами» на міжнародному ринку, особливо з обмеженнями поставок міжнародних гігантів, таких як Nvidia, на китайський ринок. Це політичне обмеження безпосередньо вплинуло на здатність китайських компаній отримувати високоякісні чіпи GPU, тим самим посилюючи дефіцит обчислювальних ресурсів. Це подвійне обмеження, безсумнівно, додало додаткової невизначеності та викликів для розвитку великомасштабних зразкових підприємств Китаю.
Наразі, хоча кількість користувачів таких продуктів, як Wenxin Iyan від Baidu та Tongyi Qianwen від Alibaba, не досягла масштабу 100 мільйонів ChatGPT, це не означає, що китайські компанії можуть легко впоратися з існуючими обчислювальними викликами. З розвитком цих продуктів і розширенням ринку, особливо коли вони почнуть широко використовуватися на ринку B-end, попит на обчислювальні потужності різко зросте. У цей час проблема дефіциту обчислювальних потужностей стане більш помітною, що може серйозно обмежити розвиток великої модельної промисловості Китаю.
У довгостроковій перспективі, якщо Китай не зможе ефективно впоратися з цим подвійним комп'ютерним вузьким місцем, то розвиток його великої модельної індустрії може бути обмежений низьким рівнем. Це не лише вплине на конкурентоспроможність внутрішнього ринку, а й обмежить вплив Китаю у сфері штучного інтелекту у глобальному масштабі. Тому вирішення проблеми дефіциту обчислювальних потужностей має вирішальне значення для майбутнього розвитку великої модельної індустрії Китаю, що є не лише технічним, а й стратегічним питанням, яке пов'язане з позицією та майбутнім Китаю у світовій конкуренції ШІ.
На тлі проблем подвійних обчислень, з якими стикається Китай, останнім часом з'явилися деякі обнадійливі позитивні ознаки, особливо в розробці вітчизняних графічних процесорів. Провідні вітчизняні технологічні компанії, такі як Baidu, Alibaba, 360 та ін., почали співпрацювати з вітчизняними виробниками графічних процесорів, такими як Huawei.
Зростання кількості вітчизняних графічних процесорів має далекосяжне значення для вирішення проблеми дефіциту обчислювальної потужності в Китаї. Якщо ці вітчизняні графічні процесори можна буде порівняти з лідером галузі NVIDIA за продуктивністю, а вузьке місце на виробничому рівні буде ефективно вирішено, то це принесе безпрецедентні можливості для великої модельної індустрії Китаю. Історично склалося так, що після того, як вітчизняна технологія дозріває, вона, як правило, може вийти на ринок за більш конкурентоспроможною ціною. Це означає, що якщо вітчизняні графічні процесори можуть бути успішними, вони, швидше за все, запропонують аналогічну або навіть кращу продуктивність за набагато нижчою ціною, ніж міжнародні бренди.
Ця економічна перевага не тільки зменшить нинішній дефіцит обчислювальних потужностей, але й матиме потенціал революціонізувати ринковий ландшафт. В даний час висока ціна графічних процесорів є важливим фактором, що обмежує популярність і застосування технології великих моделей. Якщо вітчизняні графічні процесори зможуть забезпечити високопродуктивну обчислювальну потужність за нижчою ціною, це значно сприятиме застосуванню технології великих моделей у всіх сферах життя та прискорить розвиток Китаю в галузі штучного інтелекту.
Що ще важливіше, цей розвиток подій може дозволити Китаю «перетворити поразку на перемогу» у глобальній гонці штучного інтелекту. З точки зору обчислювальної потужності і додатків великомасштабних моделей Китай може не тільки наздогнати, але навіть перевершити провідні країни, такі як США.
Звичайно, все це ще знаходиться на початку розробки, і успіх вітчизняних GPU ще потребує подолання технічних викликів. Однак з'явилися позитивні ознаки того, що Китай зробив серйозні кроки на шляху до обчислювальної автономії. Очікується, що в найближчі кілька років ми станемо свідками зрілості та широкомасштабного застосування вітчизняної технології графічних процесорів, а також того, як це сприятиме швидкому розвитку великої модельної промисловості Китаю.
Таким чином, на шляху вивчення глобальної проблеми нестачі обчислювальних потужностей ми не тільки стали свідками постійного просування технологічних кордонів, але й глибоко відчули складні виклики, що стоять перед розвитком галузі. Від історії OpenAI до подвійної дилеми великомасштабних модельних компаній Китаю та зростання вітчизняної технології графічних процесорів, все це розкриває основну істину: обчислювальні потужності стали ключовим стратегічним ресурсом на майбутньому шляху розвитку штучного інтелекту. Це не тільки конкуренція на технічному рівні, а й інвестиція і розстановка світових науково-технічних сил на майбутнє.
Заглядаючи в майбутнє, з технологічним прогресом і мінливими вимогами ринку, у нас є підстави вважати, що проблема дефіциту обчислювальних потужностей в кінцевому підсумку буде вирішена. У цьому процесі інновації, співпраця та стратегічна адаптація будуть ключовими темами, з якими має зіткнутися кожен учасник. Зрештою, цей виклик обчислювальної потужності визначить майбутнє технології штучного інтелекту та сформує наш цифровий світ.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
OpenAI паралізована, чи можуть чорні технології Китаю врятувати глобальний ШІ?
Першоджерело: Data Ape
У сучасну епоху стрімкого технологічного розвитку ChatGPT від OpenAI, безсумнівно, став яскравою зіркою у сфері штучного інтелекту. Однак зі сплеском числа його користувачів поступово спливла на поверхню проблема, яку не можна ігнорувати - дефіцит обчислювальних потужностей. Це не просто виклик для OpenAI, а проблема для всієї індустрії штучного інтелекту.
У цьому поглибленому аналізі ми розглянемо основні причини нестачі обчислювальних потужностей і те, як це впливає на розробку великих моделей і майбутнє галузі. У той же час ми також вивчимо потенційні шляхи вирішення цієї проблеми, включаючи розробку вітчизняних графічних процесорів та їх можливий вплив на світовий ринок.
Нестача обчислювальних потужностей переслідує OpenAI
Дефіцит обчислювальних потужностей завжди був гострою проблемою, з якою доводиться стикатися OpenAI у своєму швидкому зростанні. Останнім часом це питання стало більш актуальним через резонансний інцидент. Компанія OpenAI провела масштабний виставковий захід під назвою «Гала-концерт весняного фестивалю науки і технологій», продемонструвавши останні досягнення своєї технології, яка привернула велику увагу в усьому світі. У результаті потік користувачів стікався на платформу OpenAI, особливо на її зірковий продукт ChatGPT.
Однак за цим захопленням стоїть величезний виклик. Вибухове зростання кількості користувачів швидко перевищило обчислювальні потужності OpenAI. Буквально через два дні після конференції з'ясувався шокуючий факт: сервер ChatGPT вийшов з ладу. Незліченна кількість користувачів мережі повідомили, що вони не можуть нормально використовувати API, надані ChatGPT та OpenAI.
Зіткнувшись із цією кризою, OpenAI довелося прийняти рішення, яке шокувало ринок: призупинити реєстрацію нових користувачів ChatGPT Plus. Економічні витрати, що стоять за цим рішенням, величезні: 100 мільйонів нових користувачів приносять OpenAI 2 мільярди доларів доходу на місяць при щомісячній абонентській платі в розмірі 20 доларів. Така величезна потенційна вигода, але від необхідності відмовитися через дефіцит обчислювальних потужностей, безсумнівно, є вкрай пасивним вибором.
Насправді дефіцит обчислювальних потужностей – це не просто недавнє явище. З моменту запуску ChatGPT питання обчислювальної потужності залишилося в тіні. Наприклад, у квітні ChatGPT Plus також був змушений призупинити закупівлю платних товарів. Це трапляється час від часу, і, схоже, це стало нормою на шляху зростання OpenAI.
Ці події розкривають незаперечний факт: у контексті сучасного технологічного розвитку обчислювальні потужності стали основним вузьким місцем, що обмежує інновації в технологіях штучного інтелекту та розширення комерційних застосувань. Для OpenAI це не лише технічний виклик, а й стратегічний. Як знайти баланс між ринковим попитом, що стрімко зростає, і обмеженими обчислювальними ресурсами стало складною проблемою для OpenAI. Цей виклик стосується не лише короткострокових прибутків компанії, а й її довгострокової позиції на ринку та технологічного лідерства.
Сім'я поміщика не має надлишків зерна
OpenAI неодноразово заявляла, що обчислювальних потужностей недостатньо.
Ви повинні знати, що OpenAI — це зіркове підприємство з великими моделями, з величезним фінансуванням і великою кількістю обчислювальних ресурсів. Більш того, є ще й «золотий батько» Microsoft, який надає повний спектр підтримки обчислювальних потужностей. Корпорація Майкрософт має другі за величиною ресурси хмарних обчислень у світі.
З цієї точки зору OpenAI можна назвати «господарем» обчислювальних потужностей. Але реальність така, що сім'я орендодавця не має надлишків їжі. Так чому ж компанія з величезним фінансуванням і сильною підтримкою, така як Microsoft, потрапила в таке скрутне становище?
Треба визнати, що попит на обчислювальні потужності для великих моделей безпрецедентний. Ці моделі засновані на сотнях мільярдів нейронних мереж, і кожне обчислення є величезним випробуванням обчислювальної потужності. Простіше кажучи, зараз ми зіткнулися з абсолютно новим рівнем обчислювальних потреб, яким не було рівних в історії розробки програмного забезпечення. Традиційних обчислювальних ресурсів, таких як центральні процесори, тут недостатньо, а графічний процесор, на який потрібно покладатися, безсумнівно, є передовою лінією цієї технологічної революції.
Проблема з графічними процесорами, однак, полягає в тому, що вони є не тільки новими технологічними продуктами, але й стикаються з подвійними проблемами, пов'язаними з ітерацією дизайну та обмеженнями потужності. Незважаючи на зростаючий попит на графічні процесори у світі технологій, світові виробничі потужності з виробництва мікросхем не встигають за ними. Існуючі системи виробництва, упаковки та тестування напівпровідників в основному розроблені навколо процесорів, і для нових графічних процесорів вони, очевидно, не повністю адаптовані. Це означає, що попереду ще довгий шлях з точки зору збільшення потужності графічного процесора та адаптації до нових технологічних потреб.
Технологія GPU продовжує розвиватися, з кожним новим поколінням прагне підвищити продуктивність та ефективність, що вимагає постійних інвестицій у дослідження та розробки та технологічних інновацій. Однак ця безперервна ітерація технології також означає збільшення витрат на НДДКР, а також збільшення складності виробничого процесу.
Окрім питання виробничих потужностей, вартість графічних процесорів також є питанням, яке не можна ігнорувати. Щоб побудувати обчислювальний кластер GPU, який може підтримувати великомасштабні модельні обчислення, потрібні не тільки технології, а й величезні капіталовкладення. Навіть для такого технологічного гіганта, як OpenAI, це значне навантаження. Знайти баланс між витратами та вигодою – складний вибір.
Якщо навіть OpenAI бореться з нестачею обчислювальних потужностей, що буде з іншими компаніями? Це виклик не лише для OpenAI, а й для всієї індустрії штучного інтелекту. Те, що ми спостерігаємо, є величезним зрушенням: перехід від традиційних обчислень до обчислень на основі штучного інтелекту. У цій трансформації обчислювальні потужності стали найважливішим вузьким місцем.
Не можна ігнорувати той факт, що цей дефіцит стався не відразу, а є результатом невідповідності між довгостроковими технологічними розробками та ринковим попитом. Виробничі обмеження, технологічний розвиток і питання вартості чіпів GPU є багатогранними, включаючи глобальні ланцюжки поставок, технологічні інновації та економічні моделі. Високі вимоги до обчислювальної потужності великих модельних додатків створюють безпрецедентні проблеми для існуючих технологічних архітектур, змушуючи всю галузь переосмислити способи проектування, створення та оптимізації обчислювальних ресурсів.
Коли B-end додаток буде масштабовано, проблема нестачі обчислювальної потужності буде серйознішою
Є ще одне питання, яке дуже важливе, але його легко не помітити.
Коли ми говоримо про нестачу обчислювальних потужностей, ми зазвичай зосереджуємося на поточному користувацькому досвіді на стороні C. Однак це лише верхівка айсберга. Ще більш серйозна, але часто ігнорована проблема ховається в масштабі додатків на стороні Б. На даний момент, хоча великі моделі, такі як ChatGPT, в основному обслуговують користувачів C-end, це лише початок. З поступовим зростанням і зрілістю додатків B-end ми зіткнемося з безпрецедентним сплеском попиту на обчислювальні потужності.
На китайському ринку ця тенденція вже починає зароджуватися. Незважаючи на те, що такі продукти, як Baidu Wenxin Yiyan і Ali Tongyi Qianwen, в даний час в основному обслуговують користувачів C-end, їх дослідження додатків B-end вже в дорозі. В даний час більшість цих продуктів знаходяться на стадії розробки продукту, але як тільки вони перейдуть в масштабну комерційну стадію, ситуація буде зовсім іншою. Складність бізнесу на стороні Б набагато більша, ніж на стороні С. На стороні C взаємодія користувача з системою зазвичай така ж проста, як виконання запиту або команди. Однак, на стороні Б, кожен бізнес-процес може включати більш складні процеси обробки, аналізу та прийняття рішень. Ці процеси не тільки вимагають більше обчислювальних ресурсів, але і пред'являють більш високі вимоги до якості і стабільності обчислювальних потужностей.
Що ще примітно, так це те, що обчислювальна потужність B-end сервісів відбивається не тільки на складності одиничної взаємодії, але і на частоті дзвінків. На стороні Б застосування великих моделей має тенденцію бути безперервним і високочастотним, на відміну від випадкових запитів і використання на стороні С. Наприклад, у таких галузях, як фінанси, охорона здоров'я та виробництво, великі моделі повинні безперервно обробляти великі обсяги даних, щоб забезпечити аналіз у режимі реального часу та підтримку прийняття рішень. Такий попит на високочастотні високонавантажені обчислення чинить величезний тиск на обчислювальні потужності.
Можна передбачити, що з популяризацією великих моделей на стороні B її потреба в обчислювальній потужності швидко перевищить потребу в C-стороні. Цей зсув може бути незначним, але його вплив далекосяжний. З одного боку, підвищений попит на обчислювальні потужності стимулюватиме розвиток суміжних технологій, таких як більш ефективні графічні процесори та більш оптимізовані обчислювальні архітектури. З іншого боку, це також матиме значний вплив на розподіл ресурсів, структуру витрат та бізнес-модель галузі в цілому.
У процесі ми можемо побачити, як деякі компанії будуть змушені піти з ринку, тому що вони не можуть дозволити собі такі витрати на обчислювальну потужність, або ми можемо побачити, як деякі компанії виділяються передовими технологіями управління обчислювальними потужностями та оптимізації.
Китай зіткнувся з подвійним вузьким місцем обчислювальної потужності
У глобальному масштабі дефіцит обчислювальних потужностей став основним вузьким місцем у розвитку штучного інтелекту, і для Китаю ця проблема є особливо серйозною. Великомасштабним модельним компаніям Китаю доводиться мати справу не тільки з глобальним дефіцитом обчислювальних потужностей («стихійні лиха»), але й з унікальними обмеженнями ринкової пропозиції («техногенні катастрофи»), що робить перспективи розвитку Китаю в галузі великих моделей складними та складними.
Ми повинні визнати обмеженість великомасштабних зразкових підприємств Китаю в обчислювальних ресурсах. Хоча такі компанії, як Baidu, Alibaba, ByteDance, Tencent і Huawei, досягли значних успіхів у розробці великих моделей, обчислювальні проблеми, з якими вони стикаються, є реальними та нагальними. В даний час через загальний недостатній розвиток світової індустрії GPU китайські підприємства зіткнулися з серйозними перешкодами в отриманні достатньої кількості обчислювальних ресурсів. Такого роду проблеми типу «стихійного лиха» є єдиним шляхом для технологічного розвитку та модернізації промисловості, і для їх вирішення потрібен час і величезні інвестиції.
Що ще складніше, так це те, що великомасштабні модельні компанії Китаю також стикаються з «техногенними катастрофами» на міжнародному ринку, особливо з обмеженнями поставок міжнародних гігантів, таких як Nvidia, на китайський ринок. Це політичне обмеження безпосередньо вплинуло на здатність китайських компаній отримувати високоякісні чіпи GPU, тим самим посилюючи дефіцит обчислювальних ресурсів. Це подвійне обмеження, безсумнівно, додало додаткової невизначеності та викликів для розвитку великомасштабних зразкових підприємств Китаю.
Наразі, хоча кількість користувачів таких продуктів, як Wenxin Iyan від Baidu та Tongyi Qianwen від Alibaba, не досягла масштабу 100 мільйонів ChatGPT, це не означає, що китайські компанії можуть легко впоратися з існуючими обчислювальними викликами. З розвитком цих продуктів і розширенням ринку, особливо коли вони почнуть широко використовуватися на ринку B-end, попит на обчислювальні потужності різко зросте. У цей час проблема дефіциту обчислювальних потужностей стане більш помітною, що може серйозно обмежити розвиток великої модельної промисловості Китаю.
У довгостроковій перспективі, якщо Китай не зможе ефективно впоратися з цим подвійним комп'ютерним вузьким місцем, то розвиток його великої модельної індустрії може бути обмежений низьким рівнем. Це не лише вплине на конкурентоспроможність внутрішнього ринку, а й обмежить вплив Китаю у сфері штучного інтелекту у глобальному масштабі. Тому вирішення проблеми дефіциту обчислювальних потужностей має вирішальне значення для майбутнього розвитку великої модельної індустрії Китаю, що є не лише технічним, а й стратегічним питанням, яке пов'язане з позицією та майбутнім Китаю у світовій конкуренції ШІ.
На тлі проблем подвійних обчислень, з якими стикається Китай, останнім часом з'явилися деякі обнадійливі позитивні ознаки, особливо в розробці вітчизняних графічних процесорів. Провідні вітчизняні технологічні компанії, такі як Baidu, Alibaba, 360 та ін., почали співпрацювати з вітчизняними виробниками графічних процесорів, такими як Huawei.
Зростання кількості вітчизняних графічних процесорів має далекосяжне значення для вирішення проблеми дефіциту обчислювальної потужності в Китаї. Якщо ці вітчизняні графічні процесори можна буде порівняти з лідером галузі NVIDIA за продуктивністю, а вузьке місце на виробничому рівні буде ефективно вирішено, то це принесе безпрецедентні можливості для великої модельної індустрії Китаю. Історично склалося так, що після того, як вітчизняна технологія дозріває, вона, як правило, може вийти на ринок за більш конкурентоспроможною ціною. Це означає, що якщо вітчизняні графічні процесори можуть бути успішними, вони, швидше за все, запропонують аналогічну або навіть кращу продуктивність за набагато нижчою ціною, ніж міжнародні бренди.
Ця економічна перевага не тільки зменшить нинішній дефіцит обчислювальних потужностей, але й матиме потенціал революціонізувати ринковий ландшафт. В даний час висока ціна графічних процесорів є важливим фактором, що обмежує популярність і застосування технології великих моделей. Якщо вітчизняні графічні процесори зможуть забезпечити високопродуктивну обчислювальну потужність за нижчою ціною, це значно сприятиме застосуванню технології великих моделей у всіх сферах життя та прискорить розвиток Китаю в галузі штучного інтелекту.
Що ще важливіше, цей розвиток подій може дозволити Китаю «перетворити поразку на перемогу» у глобальній гонці штучного інтелекту. З точки зору обчислювальної потужності і додатків великомасштабних моделей Китай може не тільки наздогнати, але навіть перевершити провідні країни, такі як США.
Звичайно, все це ще знаходиться на початку розробки, і успіх вітчизняних GPU ще потребує подолання технічних викликів. Однак з'явилися позитивні ознаки того, що Китай зробив серйозні кроки на шляху до обчислювальної автономії. Очікується, що в найближчі кілька років ми станемо свідками зрілості та широкомасштабного застосування вітчизняної технології графічних процесорів, а також того, як це сприятиме швидкому розвитку великої модельної промисловості Китаю.
Таким чином, на шляху вивчення глобальної проблеми нестачі обчислювальних потужностей ми не тільки стали свідками постійного просування технологічних кордонів, але й глибоко відчули складні виклики, що стоять перед розвитком галузі. Від історії OpenAI до подвійної дилеми великомасштабних модельних компаній Китаю та зростання вітчизняної технології графічних процесорів, все це розкриває основну істину: обчислювальні потужності стали ключовим стратегічним ресурсом на майбутньому шляху розвитку штучного інтелекту. Це не тільки конкуренція на технічному рівні, а й інвестиція і розстановка світових науково-технічних сил на майбутнє.
Заглядаючи в майбутнє, з технологічним прогресом і мінливими вимогами ринку, у нас є підстави вважати, що проблема дефіциту обчислювальних потужностей в кінцевому підсумку буде вирішена. У цьому процесі інновації, співпраця та стратегічна адаптація будуть ключовими темами, з якими має зіткнутися кожен учасник. Зрештою, цей виклик обчислювальної потужності визначить майбутнє технології штучного інтелекту та сформує наш цифровий світ.