AI є найпопулярнішою підгалуззю у криптоіндустрії, зокрема дистрибутивна AI обчислювальна мережа Gensyn, у яку інвестує a16z з загальним фінансуванням у 50 мільйонів доларів, безсумнівно, є конкурентоспроможним проєктом. Нещодавно Gensyn офіційно запустив тестову мережу, хоча це сталося на рік пізніше, ніж планувалось, але з запуском тестової мережі, нарешті, розпочинається новий етап.
Як спеціально розроблений для машинного навчання кастомізований Ethereum Rollup, тестова мережа Gensyn інтегрує позаплатформене виконання, верифікацію та комунікаційні рамки, з метою забезпечення децентралізованих AI систем такими ключовими функціями, як постійна ідентичність, відстеження участі, збереження права власності, оплата, координація віддаленого виконання, перевірка без довіри, фіксація процесу навчання та краудфандинг масштабних навчальних завдань.
Перший етап Тестової мережі зосереджений на відстеженні участі в RL Swarm. RL Swarm — це застосунок для кооперативного навчання з підкріпленням, який дозволяє вузлам бути зв'язаними з онлайновими ідентичностями, забезпечуючи точний облік внесків кожного учасника.
RL Swarm: Основні функції та спільне навчання
У тестовій мережі Gensyn, як основний додаток, RL Swarm є системою спільного навчання моделей, побудованою на основі децентралізованої мережі. На відміну від традиційного незалежного навчання окремих моделей, RL Swarm дозволяє кільком моделям взаємодіяти, критикувати та покращувати одна одну в мережі, тим самим спільно підвищуючи загальну продуктивність. Його основна ідея полягає в "колективній мудрості", тобто через співпрацю та зворотний зв'язок між моделями вузлів досягати більш ефективних результатів навчання.
Можна просто зрозуміти, що моделі, такі як DeepSeek-R1, під час навчання на інференції можуть покращувати свої результати за допомогою самокритики, тоді як RL Swarm розширює цей механізм на групу моделей, досягаючи ефекту "багато рук — легка робота".
На основі системи RL Swarm, модель не лише покладається на власний зворотний зв'язок, а й через спостереження та оцінку роботи інших моделей виявляє свої недоліки та оптимізується. Кожен модельний вузол, що приєднується до Swarm, бере участь у трьохетапному процесі: спочатку незалежно вирішує задачу і надає свої ідеї та відповіді, потім переглядає відповіді інших вузлів та надає зворотний зв'язок, і нарешті модель голосує за найкраще рішення і відповідно коригує свої виходи. Цей кооперативний механізм не лише підвищує продуктивність кожної моделі, а й сприяє еволюції всієї групи моделей. Моделі, які приєднуються до Swarm, після виходу можуть зберігати покращене локальне ваги та отримувати реальну вигоду.
Крім того, Gensyn відкрив код RL Swarm, що дозволяє будь-кому запускати вузли, створювати або приєднуватися до існуючого Swarm без дозволу. Основна комунікація Swarm використовує протокол gossip, наданий Hivemind, що підтримує децентралізовану передачу повідомлень між моделями та обмін навчальними сигналами. Незалежно від того, чи це домашній ноутбук, чи на GPU в хмарі, можна взяти участь у спільному навчанні, приєднавшись до вузлів RL Swarm.
Інфраструктура три основні стовпи: виконання, зв'язок та перевірка
Наразі RL Swarm все ще є експериментальною демонстрацією, яка показує масштабний, програмований метод машинного навчання, а не кінцеву форму продукту. Протягом останніх чотирьох років основна робота Gensyn фактично полягала у створенні базової інфраструктури, і після випуску Тестової мережі вона перейшла до етапу v0.1, який вже можна фактично використовувати. Згідно з офіційним описом, загальна архітектура Gensyn поділяється на три частини: виконання, зв'язок та верифікацію.
Виконання (Execution): узгодженість та розподілена обчислювальна потужність
Gensyn вважає, що майбутнє машинного навчання більше не обмежується традиційними монолітними моделями, а складається з фрагментованих параметрів, розподілених на різних пристроях по всьому світу. Для досягнення цієї мети команда Gensyn розробила підпорядковану архітектуру виконання, яка забезпечує узгодженість між пристроями. Ключовими технологіями є:
Розподілене зберігання параметрів та навчання: завдяки розділенню великомасштабної моделі на кілька блоків параметрів та їх розподілу на різних пристроях, Gensyn реалізував фрагментацію моделі, зменшуючи вимоги до пам'яті для окремого вузла.
Після навчання з підкріпленням (RL Post-Training): дослідження показують, що коли модель тренується колективно, спілкуючись та критикуючи відповіді один одного, загальна ефективність навчання суттєво зростає. Gensyn демонструє цю концепцію за допомогою RL Swarm, дозволяючи моделі швидко прогресувати під час колективних обговорень, що додатково підтверджує ефективність розподіленого виконання.
Репліковані операції (RepOps): Щоб забезпечити повну відповідність результатів обчислень на різному обладнанні (такому як Nvidia A100 та H100), Gensyn розробила бібліотеку RepOps, яка реалізує побітну реплікацію через фіксацію порядку виконання плаваючих чисел.
Зв'язок (Communication): ефективний обмін інформацією
У сценаріях масового розподіленого навчання ефективна комунікація між вузлами є надзвичайно важливою. Традиційні методи паралельних даних, хоча і можуть зменшити витрати на зв'язок в певній мірі, але через вимогу зберігати повну модель на кожному вузлі їхня масштабованість обмежена пам'яттю. Для цього Gensyn запропонував абсолютно нове рішення:
SkipPipe – динамічний паралелізм пропускної труби: технологія SkipPipe пропускає частини традиційного конвеєра, динамічно вибираючи обчислювальний рівень, через який проходить мікропакет, тим самим скорочуючи непотрібний час очікування. Його інноваційний алгоритм планування може оцінювати доступність кожного шляху в режимі реального часу, що не тільки скорочує час простою вузлів, але і значно скорочує загальний час навчання. Згідно з даними тестування, SkipPipe може скоротити час навчання приблизно на 55% в децентралізованому середовищі, і знизити продуктивність моделі лише приблизно на 7% у разі часткової відмови вузла.
Стандарти зв'язку та співпраця між вузлами Компанія Gensyn створила набір протоколів зв'язку, подібних до TCP/IP, що забезпечують ефективну та безперебійну передачу даних та обмін інформацією для учасників у всьому світі, незалежно від використовуваного пристрою. Цей відкритий стандарт забезпечує міцну мережеву основу для розподіленого спільного навчання.
Верифікація: забезпечення довіри та безпеки
У бездоверчій розподіленій мережі підтвердити, що результати розрахунків, подані всіма учасниками, є справжніми та дійсними, є великою проблемою. Gensyn для цього запровадила спеціальний протокол верифікації, що має на меті забезпечити всіх постачальників обчислювальної потужності правильними робочими результатами за допомогою низько вартісного та ефективного механізму:
Протокол верифікації Verde: Verde є першим верифікаційним системою, спеціально розробленою для сучасного машинного навчання. Її суть полягає в використанні легкого механізму вирішення суперечок, що дозволяє швидко визначити етап, на якому виникає розбіжність між моделлю та верифікатором під час навчання. На відміну від традиційних методів верифікації, які вимагають повторного виконання всього завдання, Verde вимагає лише повторних обчислень суперечливих дій, що суттєво знижує витрати на верифікацію.
референтна делегація (裁决式委托): використовуючи цей метод, якщо у постачальника є проблеми з виходом, валідатор може через ефективну гру вирішення суперечок переконати нейтрального арбітра, щоб гарантувати, що, принаймні, один чесний вузол існує, правильність всього результату обчислення забезпечена.
Зберігання та хешування проміжного стану: для підтримки вищезгаданого процесу верифікації учасникам потрібно лише зберігати та хешувати частину проміжних навчальних контрольних точок, а не всі дані, що зменшує використання ресурсів і підвищує масштабованість та реальний час системи.
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
Онлайн-тестова мережа Gensyn, як зробити навчання AI більш ефективним та більш децентралізованим?
Автор: Zen, PANews
AI є найпопулярнішою підгалуззю у криптоіндустрії, зокрема дистрибутивна AI обчислювальна мережа Gensyn, у яку інвестує a16z з загальним фінансуванням у 50 мільйонів доларів, безсумнівно, є конкурентоспроможним проєктом. Нещодавно Gensyn офіційно запустив тестову мережу, хоча це сталося на рік пізніше, ніж планувалось, але з запуском тестової мережі, нарешті, розпочинається новий етап.
Як спеціально розроблений для машинного навчання кастомізований Ethereum Rollup, тестова мережа Gensyn інтегрує позаплатформене виконання, верифікацію та комунікаційні рамки, з метою забезпечення децентралізованих AI систем такими ключовими функціями, як постійна ідентичність, відстеження участі, збереження права власності, оплата, координація віддаленого виконання, перевірка без довіри, фіксація процесу навчання та краудфандинг масштабних навчальних завдань.
Перший етап Тестової мережі зосереджений на відстеженні участі в RL Swarm. RL Swarm — це застосунок для кооперативного навчання з підкріпленням, який дозволяє вузлам бути зв'язаними з онлайновими ідентичностями, забезпечуючи точний облік внесків кожного учасника.
RL Swarm: Основні функції та спільне навчання
У тестовій мережі Gensyn, як основний додаток, RL Swarm є системою спільного навчання моделей, побудованою на основі децентралізованої мережі. На відміну від традиційного незалежного навчання окремих моделей, RL Swarm дозволяє кільком моделям взаємодіяти, критикувати та покращувати одна одну в мережі, тим самим спільно підвищуючи загальну продуктивність. Його основна ідея полягає в "колективній мудрості", тобто через співпрацю та зворотний зв'язок між моделями вузлів досягати більш ефективних результатів навчання.
Можна просто зрозуміти, що моделі, такі як DeepSeek-R1, під час навчання на інференції можуть покращувати свої результати за допомогою самокритики, тоді як RL Swarm розширює цей механізм на групу моделей, досягаючи ефекту "багато рук — легка робота".
На основі системи RL Swarm, модель не лише покладається на власний зворотний зв'язок, а й через спостереження та оцінку роботи інших моделей виявляє свої недоліки та оптимізується. Кожен модельний вузол, що приєднується до Swarm, бере участь у трьохетапному процесі: спочатку незалежно вирішує задачу і надає свої ідеї та відповіді, потім переглядає відповіді інших вузлів та надає зворотний зв'язок, і нарешті модель голосує за найкраще рішення і відповідно коригує свої виходи. Цей кооперативний механізм не лише підвищує продуктивність кожної моделі, а й сприяє еволюції всієї групи моделей. Моделі, які приєднуються до Swarm, після виходу можуть зберігати покращене локальне ваги та отримувати реальну вигоду.
Крім того, Gensyn відкрив код RL Swarm, що дозволяє будь-кому запускати вузли, створювати або приєднуватися до існуючого Swarm без дозволу. Основна комунікація Swarm використовує протокол gossip, наданий Hivemind, що підтримує децентралізовану передачу повідомлень між моделями та обмін навчальними сигналами. Незалежно від того, чи це домашній ноутбук, чи на GPU в хмарі, можна взяти участь у спільному навчанні, приєднавшись до вузлів RL Swarm.
Інфраструктура три основні стовпи: виконання, зв'язок та перевірка
Наразі RL Swarm все ще є експериментальною демонстрацією, яка показує масштабний, програмований метод машинного навчання, а не кінцеву форму продукту. Протягом останніх чотирьох років основна робота Gensyn фактично полягала у створенні базової інфраструктури, і після випуску Тестової мережі вона перейшла до етапу v0.1, який вже можна фактично використовувати. Згідно з офіційним описом, загальна архітектура Gensyn поділяється на три частини: виконання, зв'язок та верифікацію.
Виконання (Execution): узгодженість та розподілена обчислювальна потужність
Gensyn вважає, що майбутнє машинного навчання більше не обмежується традиційними монолітними моделями, а складається з фрагментованих параметрів, розподілених на різних пристроях по всьому світу. Для досягнення цієї мети команда Gensyn розробила підпорядковану архітектуру виконання, яка забезпечує узгодженість між пристроями. Ключовими технологіями є:
Зв'язок (Communication): ефективний обмін інформацією
У сценаріях масового розподіленого навчання ефективна комунікація між вузлами є надзвичайно важливою. Традиційні методи паралельних даних, хоча і можуть зменшити витрати на зв'язок в певній мірі, але через вимогу зберігати повну модель на кожному вузлі їхня масштабованість обмежена пам'яттю. Для цього Gensyn запропонував абсолютно нове рішення:
Верифікація: забезпечення довіри та безпеки
У бездоверчій розподіленій мережі підтвердити, що результати розрахунків, подані всіма учасниками, є справжніми та дійсними, є великою проблемою. Gensyn для цього запровадила спеціальний протокол верифікації, що має на меті забезпечити всіх постачальників обчислювальної потужності правильними робочими результатами за допомогою низько вартісного та ефективного механізму: