Gensyn Testnet'i çevrimiçi, AI eğitimini daha verimli ve daha merkeziyetsiz hale nasıl getirebiliriz?

robot
Abstract generation in progress

Gensyn Testnet上线,如何让AI训练更高效、更 merkeziyetsizlik?

Yazar: Zen, PANews

AI, günümüz kripto endüstrisinde en çok dikkat çeken alt alanlardan biridir; a16z'nin liderlik ettiği ve toplam finansman büyüklüğü 50 milyon dolara ulaşan dağıtık AI hesaplama ağı Gensyn, şüphesiz rekabetçi bir projedir. Yakın zamanda, Gensyn resmi olarak Testnet'e geçti; planlanan zamandan bir yıldan fazla gecikmiş olmasına rağmen, Testnet'in devreye girmesiyle yeni bir aşamaya girmiştir.

Makine öğrenimi için özel olarak tasarlanmış bir özelleştirilmiş Ethereum Rollup olan Gensyn Testnet, zincir dışı yürütme, doğrulama ve iletişim çerçevesini entegre ederek merkeziyetsiz AI sistemlerine kalıcı kimlik, katılım takibi, mülkiyet bakımı, ödeme, uzaktan yürütme koordinasyonu, güvensiz doğrulama, eğitim süreci kaydı ve büyük ölçekli eğitim görevleri için kitlesel fonlama gibi kritik işlevler sunmayı amaçlamaktadır.

Testnet'in ilk aşaması, RL Swarm içindeki katılım durumunu izlemeye odaklanmaktadır. RL Swarm, işbirlikçi pekiştirmeli öğrenme sonrası eğitim için bir uygulamadır ve düğümleri zincir üzerindeki kimliklerle bağlayarak her katılımcı düğümün katkısının doğru bir şekilde kaydedilmesini sağlar.

RL Swarm: Temel Özellikler ve İşbirlikçi Eğitim

Gensyn Testnet'te, temel uygulama olarak RL Swarm, merkeziyetsizlik ağına dayalı bir model işbirliği eğitim sistemidir. Geleneksel bağımsız eğitim yapan tekil modellere kıyasla, RL Swarm, birden fazla modelin ağ içinde birbirleriyle iletişim kurmasını, eleştirmesini ve geliştirmesini sağlar, böylece toplam performansı artırır. Temel felsefesi "toplumsal zeka"dır; bu, düğüm modelleri arasındaki işbirliği ve geri bildirim yoluyla daha etkili bir eğitim sonucu elde etmeyi amaçlar.

Basitçe, DeepSeek-R1 gibi modellerin çıkarım eğitimi sırasında, çıkarım performansını geliştirmek için öz eleştiri yoluyla iteratif bir yükseltme yapabileceği ve RL Swarm'ın bu mekanizmayı çoklu model gruplarına genişleterek "çok başlı bir ateşin daha yüksek yanmasını" sağladığı şeklinde anlaşılabilir.

RL Swarm sistemine dayanan bu model, sadece kendi geri bildirimlerine değil, aynı zamanda diğer modellerin performansını gözlemleyerek ve değerlendirerek kendi eksikliklerini tanımlayıp optimize etmeye de dayanır. Swarm'a katılan her bir model düğümü, üç aşamalı bir süreçte yer alır: Öncelikle bağımsız olarak bir problemi tamamlayıp düşüncelerini ve yanıtlarını sunar, ardından diğer düğümlerin yanıtlarını gözden geçirip geri bildirimde bulunur, son olarak en iyi çözümü seçmek için model oylaması yapar ve buna göre kendi çıktısını düzeltir. Bu işbirliği mekanizması, her bir modelin performansını artırmakla kalmaz, aynı zamanda tüm grup modelinin evrimini de teşvik eder. Swarm'a katılan modeller, ayrıldıktan sonra bile geliştirilmiş yerel ağırlıklarını koruyarak gerçek kazanç elde ederler.

Gensyn Testnet上线,如何让AI训练更高效、更 merkeziyetsizlik?

Ayrıca, Gensyn RL Swarm'ın kodunu açtı, herkes düğüm çalıştırabilir, mevcut Swarm'a katılabilir veya onu başlatabilir, izin almaya gerek yoktur. Swarm'ın temel iletişimi Hivemind tarafından sağlanan gossip protokolünü kullanır, modelar arasında merkeziyetsizlik mesajlaşması ve öğrenme sinyali paylaşımını destekler. İster ev bilgisayarı, ister bulut GPU'sunda RL Swarm düğümüne katılarak işbirlikçi eğitime katılabilirsiniz.

Altyapı üç temel sütun: yürütme, iletişim ve doğrulama

Şu anda RL Swarm hala sadece deneysel bir gösterimdir, büyük ölçekli, ölçeklenebilir bir makine öğrenimi yöntemini sergilemektedir ve nihai ürün biçimi değildir. Son dört yılda, Gensyn'in temel çalışması aslında alt yapıyı inşa etmek olmuştur, testnetin yayınlanmasının ardından v0.1 aşamasına geçilmiş olup, artık pratikte çalıştırılabilir. Resmi tanıma göre, Gensyn'in genel mimarisi üç bölümden oluşmaktadır: yürütme, iletişim ve doğrulama.

İcra (Execution): Tutarlılık ve Dağıtık Hesaplama Gücü

Gensyn, gelecekteki makine öğreniminin geleneksel monolitik modellere sınırlı kalmayacağını, aksine dünya genelindeki cihazlarda dağıtılmış parçalı parametrelerden oluşacağını düşünüyor. Bu hedefe ulaşmak için Gensyn ekibi, cihazlar arası tutarlılığı sağlamayı mümkün kılan bir temel yürütme mimarisi geliştirdi. Buradaki anahtar teknolojiler şunlardır:

  • Dağıtık parametre depolama ve eğitim: Gensyn, büyük ölçekli modelleri birden fazla parametre parçasına ayırarak ve bunları farklı cihazlara dağıtarak modelin parçalı dağıtımını gerçekleştirir, böylece tek bir düğümün bellek gereksinimlerini azaltır.
  • Pekiştirme Öğrenimi Sonrası Eğitim (RL Post-Training): Araştırmalar, modellerin toplu şekilde işbirliği yaparak, birbirleriyle iletişim kurarak ve birbirlerinin cevaplarını eleştirerek eğitildiğinde, genel öğrenme verimliliğinin önemli ölçüde arttığını göstermektedir. Gensyn, RL Swarm ile bu konsepti sergileyerek, modellerin toplu tartışmalar içinde hızlı bir şekilde ilerlemesini sağladı ve dağıtılmış yürütmenin etkinliğini daha da doğrulamıştır.
  • Tekrar Edilebilir Operatörler (RepOps): Farklı donanımların (örneğin Nvidia A100 ve H100) tamamen aynı hesaplama sonuçlarını elde edebilmesini sağlamak için Gensyn, sabit kayan nokta işlemlerinin yürütme sırasını belirleyerek platformlar arası bit düzeyinde tekrar edilebilirlik sağlamak amacıyla RepOps kütüphanesini geliştirmiştir.

İletişim (Communication): Verimli bilgi etkileşimi

Büyük ölçekli dağıtılmış eğitim senaryolarında, düğümler arasındaki verimli iletişim son derece önemlidir. Geleneksel veri paralelliği yöntemleri belirli bir ölçüde iletişim maliyetlerini azaltabilse de, her düğümün tam modeli depolamasını gerektirdiğinden, ölçeklenebilirliği bellek kısıtlamaları ile sınırlıdır. Bu nedenle, Gensyn tamamen yeni bir çözüm önerdi:

  • SkipPipe – Dinamik Atlama Borusu Paralelliği: SkipPipe teknolojisi, mikropartinin geçtiği bilgi işlem katmanını dinamik olarak seçerek geleneksel bir boru hattının parçalarını atlar ve böylece gereksiz bekleme sürelerini azaltır. Yenilikçi zamanlama algoritması, her yolun kullanılabilirliğini gerçek zamanlı olarak değerlendirebilir, bu da yalnızca düğümlerin boşta kalma süresini azaltmakla kalmaz, aynı zamanda genel eğitim süresini de büyük ölçüde kısaltır. Test verilerine göre SkipPipe, merkezi olmayan bir ortamda eğitim süresini yaklaşık %55 oranında azaltabilir ve kısmi düğüm arızası durumunda model performansını yalnızca yaklaşık %7 oranında azaltabilir.
  • İletişim standartları ve düğümler arası işbirliği Gensyn, dünyanın dört bir yanındaki katılımcıların hangi cihazı kullandıklarından bağımsız olarak verimli ve kesintisiz veri aktarımı ve bilgi etkileşimi yapabilmelerini sağlayan TCP/IP benzeri bir iletişim protokolü geliştirmiştir. Bu açık standart, dağıtık işbirlikçi eğitim için sağlam bir ağ temeli sağlamaktadır.

Doğrulama (Verification): Güven ve emniyetin sağlanması

Güvene dayalı olmayan dağıtılmış bir ağda, çeşitli katılımcılar tarafından gönderilen hesaplamaların doğru ve geçerli olduğunu doğrulamak zordur. Gensyn, tüm hashrate satıcılarının düşük maliyetli, yüksek verimli bir mekanizma aracılığıyla doğru sonuçları vermesini sağlamak için özel bir doğrulama protokolü başlattı:

  • Verde Doğrulama Protokolü: Verde, modern makine öğrenimi için özel olarak tasarlanmış ilk doğrulama sistemidir. Temelinde, hafif bir ihtilaf çözüm mekanizması kullanarak, eğitim sürecinde model ile doğrulayıcı arasında ortaya çıkan ihtilaflı adımı hızlı bir şekilde belirlemek yatmaktadır. Geleneksel olarak tüm görevi yeniden çalıştırmayı gerektiren doğrulama yöntemlerinin aksine, Verde yalnızca ihtilaflı işlemi yeniden hesaplayarak doğrulama maliyetlerini büyük ölçüde azaltmaktadır.
  • hakemli delegasyon (裁决式委托): Bu yöntem kullanıldığında, eğer bir tedarikçinin çıktısında bir sorun varsa, doğrulayıcı, tarafsız bir hakem ile etkili bir ihtilaf çözme oyunu aracılığıyla ikna edebilir ve en az bir dürüst düğüm mevcut olduğunda, tüm hesaplama sonuçlarının doğruluğunu garanti altına alır.
  • Depolama ve Hash Ara Durumu: Yukarıda belirtilen doğrulama sürecini desteklemek için katılımcıların yalnızca kısmi ara eğitim kontrol noktalarını depolayıp hashlemeleri yeterlidir, bu da hem kaynak kullanımını azaltır hem de sistemin ölçeklenebilirliğini ve gerçek zamanlılığını artırır.
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin