Gensyn測試網上線,如何讓AI訓練更高效、更去中心化?

robot
摘要生成中

Gensyn測試網上線,如何讓AI訓練更高效、更去中心化?

作者:Zen,PANews

AI是如今加密行業最受關注的細分賽道,其中a16z 領投、總融資規模達 5000 萬美元的分佈式 AI 計算網絡 Gensyn 無疑是個具有競爭力的項目。近日,Gensyn正式上線測試網,雖然比原計劃時間晚了一年多,但隨著測試網上線終於進入新的階段。

作為一款專為機器學習打造的 定製化 Ethereum Rollup,Gensyn 測試網集成了 鏈下執行、驗證和通信框架,旨在為去中心化 AI 系統提供 持久身份、參與追蹤、歸屬維護、支付、遠程執行協調、去信任驗證、訓練過程記錄以及大規模訓練任務眾籌 等關鍵功能。

測試網的第一階段重點關注在 RL Swarm 內追蹤參與情況。RL Swarm 是一個用於協作式強化學習後訓練的應用,其節點可與鏈上身份綁定,從而確保每個參與節點的貢獻得到準確記錄。

RL Swarm:核心功能與協同訓練

在Gensyn 測試網中,作為核心應用的 RL Swarm 是一個基於去中心化網絡構建的模型協同訓練系統。與傳統單一模型獨立訓練不同,RL Swarm 讓多個模型在網絡中相互交流、批評和改進,從而共同提升整體性能。其核心理念在於“群體智慧”,即通過各節點模型之間的協作和反饋,實現更高效的訓練效果。

可以簡單理解為,DeepSeek-R1等模型進行推理訓練時,能夠通過自我批評來迭代提升推理表現,而 RL Swarm 則將這種機制擴展到了多模型的群體中,實現了“眾人拾柴火焰高”的效果。

基於RL Swarm系統,模型不僅依賴自身反饋,還通過觀察和評價其他模型的表現,識別出自身的不足並進行優化。每一個加入 Swarm 的模型節點都在參與一個三階段的過程:首先獨立完成問題並輸出思路與答案,然後查看其他節點的答案並提供反饋,最終模型投票選出最優解,並據此修正自己的輸出。這種協同機制不僅提高了每個模型的表現,也推動了整個群體模型的進化。加入 Swarm 的模型在離開後仍能保留改進後的本地權重,獲得實際收益。

Gensyn測試網上線,如何讓AI訓練更高效、更去中心化?

此外,Gensyn對RL Swarm 的代碼進行了開源,任何人都可以運行節點,啟動或加入現有 Swarm,無需許可。Swarm 的底層通信使用了 Hivemind 提供的 gossip 協議,支持模型間的去中心化消息傳遞與學習信號共享。不論是家用筆記本,還是在雲端 GPU 上都可以通過加入 RL Swarm 節點參與到協同訓練中來。

基礎設施三大支柱:執行、通信與驗證

目前RL Swarm 仍然只是一個實驗性演示,它展示了一種大規模、可擴展的機器學習方法,而非最終的產品形態。在過去四年,Gensyn的核心工作實際上是構建底層基礎設施,在發佈測試網後便進入了v0.1階段,已經可以實際運行。根據官方介紹,Gensyn 的整體架構分為執行、通信和驗證三個部分。

執行(Execution):一致性與分佈式算力

Gensyn 認為,未來的機器學習不再侷限於傳統的單體模型,而是由分佈在全球各個設備上的碎片化參數組成。為了實現這一目標,Gensyn團隊開發了能夠確保跨設備一致性的底層執行架構。其中的關鍵技術包括:

  • 分佈式參數存儲與訓練:通過將大規模模型分割成多個參數塊並分佈於不同設備上,Gensyn 實現了模型的碎片化部署,降低了單個節點對內存的要求。
  • 強化學習後訓練(RL Post-Training):研究表明,當模型以群體方式協同訓練、互相溝通並批判彼此的答案時,整體學習效率會顯著提升。Gensyn 利用 RL Swarm 演示了這一概念,讓模型在集體討論中快速進步,進一步驗證了分佈式執行的有效性。
  • 可復現算子(RepOps):為了確保不同硬件(如 Nvidia A100 與 H100)能夠得出完全一致的計算結果,Gensyn 開發了 RepOps 庫,通過固定浮點運算的執行順序,實現了跨平臺的逐位復現。

通信(Communication):高效信息交互

在大規模分佈式訓練場景中,各節點間的高效通信至關重要。傳統的數據並行方法雖然能在一定程度上降低通信開銷,但由於要求每個節點存儲完整模型,其擴展性受到內存限制。為此,Gensyn 提出了全新的解決方案:

  • SkipPipe – 動態跳躍管道並行:SkipPipe 技術通過動態選擇微批次(microbatch)經過的計算層,將傳統流水線中的部分階段跳過,從而減少不必要的等待時間。其創新的調度算法能夠實時評估各路徑的可用性,既降低了節點空閒時間,又大幅縮短了整體訓練時長。據測試數據顯示,在去中心化環境中,SkipPipe 可將訓練時間減少約 55%,且在部分節點故障的情況下,模型性能僅降低 7% 左右。
  • 通信標準與跨節點協作 Gensyn 構建了一套類似於 TCP/IP 的通信協議,使得全球各地參與者無論使用何種設備,都能高效、無縫地進行數據傳輸和信息交互。這種開放標準為分佈式協同訓練提供了堅實的網絡基礎。

驗證(Verification):確保信任與安全

在一個無需信任的分佈式網絡中,如何確認各參與方提交的計算結果真實有效,是一大挑戰。Gensyn 為此引入了專門的驗證協議,旨在通過低成本、高效的機制確保所有算力供應商提供正確的工作結果:

  • Verde 驗證協議:Verde 是首個專為現代機器學習設計的驗證系統。其核心在於利用輕量級爭議解決機制,快速定位出訓練過程中模型與驗證者之間產生分歧的那一步驟。與傳統需要重新運行整個任務的驗證方式不同,Verde 只需對爭議操作重新計算,從而大幅降低了驗證開銷。
  • refereed delegation(裁決式委託):採用這種方法後,若某個供應商的輸出存在問題,驗證者便能通過高效的爭議解決遊戲說服中立仲裁方,確保至少有一位誠實節點存在時,整個計算結果的正確性得以保障。
  • 存儲與哈希中間狀態:為了支持上述驗證過程,參與者只需存儲並哈希部分中間訓練檢查點,而非全量數據,這既降低了資源佔用,也提升了系統的擴展性和實時性。
查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate.io APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)