Gensyn Testnet ออนไลน์แล้ว จะทำอย่างไรให้การฝึก AI มีประสิทธิภาพมากขึ้นและการกระจายอำนาจมากขึ้น?

robot
ดำเนินการเจนเนเรชั่นบทคัดย่อ

Gensyn Testnet เปิดตัวแล้ว, จะทำอย่างไรให้การฝึก AI มีประสิทธิภาพมากขึ้นและกระจายอำนาจมากขึ้น?

ผู้เขียน:Zen,PANews

AI เป็นสนามย่อยที่ได้รับความสนใจมากที่สุดในอุตสาหกรรมการเข้ารหัสในปัจจุบัน โดยที่ Gensyn ซึ่งเป็นเครือข่ายการคำนวณ AI แบบกระจายที่มีการจัดการลงทุนโดย a16z และมีขนาดการระดมทุนรวมถึง 50 ล้านดอลลาร์สหรัฐนั้นไม่ต้องสงสัยเลยว่าเป็นโครงการที่มีความสามารถในการแข่งขัน ล่าสุด Gensyn ได้เปิดตัวอย่างเป็นทางการบน Testnet ถึงแม้ว่าจะล่าช้ากว่ากำหนดการเดิมไปมากกว่าหนึ่งปี แต่การเปิดตัวใน Testnet นั้นได้เข้าสู่ขั้นตอนใหม่ในที่สุด.

Gensyn Testnet เป็น Ethereum Rollup ที่ปรับแต่งสำหรับการเรียนรู้ของเครื่อง โดยรวมการดำเนินการนอก-chain การตรวจสอบ และกรอบการสื่อสาร มีจุดมุ่งหมายเพื่อมอบฟังก์ชันสำคัญต่างๆ เช่น ตัวตนถาวร การติดตามการมีส่วนร่วม การบำรุงรักษาสิทธิ การชำระเงิน การประสานงานการดำเนินการระยะไกล การตรวจสอบที่ไม่ต้องการความเชื่อใจ การบันทึกกระบวนการฝึกอบรม และการระดมทุนสำหรับงานฝึกอบรมในขนาดใหญ่ สำหรับระบบ AI ที่กระจายอำนาจ

ในระยะที่หนึ่งของ Testnet มุ่งเน้นไปที่การติดตามสถานะการเข้าร่วมใน RL Swarm RL Swarm เป็นแอปพลิเคชันสำหรับการฝึกฝนการเรียนรู้เชิงเสริมแบบร่วมมือ ซึ่งโหนดสามารถผูกกับตัวตนบนเชนได้ เพื่อให้แน่ใจว่าการมีส่วนร่วมของโหนดแต่ละตัวได้รับการบันทึกอย่างถูกต้อง.

RL Swarm:ฟังก์ชันหลักและการฝึกอบรมร่วมกัน

ใน Gensyn Testnet RL Swarm ซึ่งเป็นแอปพลิเคชันหลัก เป็นระบบการฝึกอบรมร่วมกันของโมเดลที่สร้างขึ้นบนเครือข่ายการกระจายอำนาจ แตกต่างจากการฝึกอบรมโมเดลเดียวแบบดั้งเดิม RL Swarm ช่วยให้โมเดลหลายตัวสามารถสื่อสาร วิจารณ์ และปรับปรุงซึ่งกันและกันในเครือข่าย เพื่อยกระดับประสิทธิภาพรวม แนวคิดหลักคือ "ปัญญารวมกลุ่ม" ซึ่งหมายถึงการร่วมมือและข้อเสนอแนะแบบระหว่างโมเดลของแต่ละโหนด เพื่อให้ได้ผลการฝึกอบรมที่มีประสิทธิภาพมากขึ้น.

สามารถเข้าใจได้ง่ายว่า เมื่อโมเดลเช่น DeepSeek-R1 ทำการฝึกอบรมการอนุมาน จะสามารถปรับปรุงประสิทธิภาพการอนุมานผ่านการวิจารณ์ตนเอง ในขณะที่ RL Swarm ได้ขยายกลไกนี้ไปยังกลุ่มของโมเดลหลายตัว ทำให้เกิดผลลัพธ์ที่เรียกว่า "การรวมพลังทำให้ไฟแรงขึ้น".

จากระบบ RL Swarm โมเดลไม่เพียง แต่อาศัยข้อเสนอแนะของตัวเอง แต่ยังระบุข้อบกพร่องของตัวเองและเพิ่มประสิทธิภาพโดยการสังเกตและประเมินประสิทธิภาพของรุ่นอื่น ๆ แต่ละโหนดโมเดลที่เข้าร่วม Swarm มีส่วนร่วมในกระบวนการสามขั้นตอน: ขั้นแรกให้เสร็จสิ้นปัญหาอย่างอิสระและส่งออกแนวคิดและคําตอบจากนั้นตรวจสอบคําตอบของโหนดอื่น ๆ และให้ข้อเสนอแนะและในที่สุดโมเดลจะโหวตโซลูชันที่ดีที่สุดและแก้ไขผลลัพธ์ตามนั้น กลไกการทํางานร่วมกันนี้ไม่เพียง แต่ช่วยปรับปรุงประสิทธิภาพของแต่ละรุ่น แต่ยังส่งเสริมวิวัฒนาการของแบบจําลองประชากรทั้งหมด โมเดลที่เข้าร่วม Swarm จะสามารถรักษาน้ําหนักในท้องถิ่นที่ได้รับการปรับปรุงได้หลังจากที่พวกเขาจากไป และเก็บเกี่ยวผลประโยชน์ที่แท้จริง

Gensyn Testnet เปิดตัวแล้ว จะทำอย่างไรให้การฝึก AI มีประสิทธิภาพมากขึ้นและมีการกระจายอำนาจมากขึ้น?

นอกจากนี้ Gensyn ได้เปิดซอร์สโค้ดของ RL Swarm ให้ทุกคนสามารถรันโหนด เริ่มต้นหรือเข้าร่วม Swarm ที่มีอยู่ โดยไม่ต้องขออนุญาต การสื่อสารพื้นฐานของ Swarm ใช้โปรโตคอล gossip ที่จัดเตรียมโดย Hivemind รองรับการส่งข้อความแบบกระจายอำนาจระหว่างโมเดลและการแบ่งปันสัญญาณการเรียนรู้ ไม่ว่าจะเป็นโน้ตบุ๊กที่บ้านหรือบน GPU ในคลาวด์ก็สามารถเข้าร่วมการฝึกอบรมร่วมกันได้โดยการเข้าร่วมโหนด RL Swarm.

โครงสร้างพื้นฐานสามเสาหลัก: การดำเนินการ, การสื่อสาร และการตรวจสอบ

ปัจจุบัน RL Swarm ยังคงเป็นเพียงการสาธิตเชิงทดลอง ซึ่งแสดงให้เห็นถึงวิธีการเรียนรู้ของเครื่องที่มีขนาดใหญ่และสามารถขยายได้ ไม่ใช่รูปแบบผลิตภัณฑ์สุดท้าย ในช่วงสี่ปีที่ผ่านมา งานหลักของ Gensyn จริง ๆ คือการสร้างโครงสร้างพื้นฐานพื้นฐาน ซึ่งเข้าสู่ขั้นตอน v0.1 หลังจากการเปิดตัว Testnet และสามารถทำงานได้จริง ตามข้อมูลอย่างเป็นทางการ สถาปัตยกรรมโดยรวมของ Gensyn แบ่งออกเป็นสามส่วน ได้แก่ การดำเนินการ การสื่อสาร และการตรวจสอบ.

การดำเนินการ (Execution): ความสอดคล้องและพลังการคำนวณแบบกระจาย

Gensyn เชื่อว่าในอนาคตการเรียนรู้ของเครื่องจะไม่จำกัดอยู่แค่โมเดลเดี่ยวแบบดั้งเดิม แต่จะประกอบด้วยพารามิเตอร์ที่กระจายอยู่ในอุปกรณ์ทั่วโลก ในการบรรลุเป้าหมายนี้ ทีมงาน Gensyn ได้พัฒนาสถาปัตยกรรมการดำเนินการพื้นฐานที่สามารถรับประกันความสอดคล้องข้ามอุปกรณ์ เทคโนโลยีหลักที่รวมอยู่ ได้แก่:

  • การจัดเก็บและฝึกอบรมพารามิเตอร์แบบกระจาย: โดยการแบ่งโมเดลขนาดใหญ่เป็นหลายบล็อกพารามิเตอร์และกระจายไปยังอุปกรณ์ต่างๆ Gensyn จึงสามารถทำการปรับใช้โมเดลแบบเป็นชิ้นส่วนได้ ซึ่งช่วยลดความต้องการหน่วยความจำของโหนดเดียว.
  • การฝึกหลังการเรียนรู้เชิงเสริม (RL Post-Training): การศึกษาชี้ให้เห็นว่าเมื่อโมเดลได้รับการฝึกอบรมร่วมกันในลักษณะกลุ่ม สื่อสารกันและวิจารณ์คำตอบของกันและกัน ประสิทธิภาพการเรียนรู้โดยรวมจะเพิ่มขึ้นอย่างมีนัยสำคัญ Gensyn ได้ใช้ RL Swarm ในการสาธิตแนวคิดนี้ ทำให้โมเดลก้าวหน้าอย่างรวดเร็วในการอภิปรายกลุ่ม และยืนยันถึงประสิทธิภาพของการดำเนินงานแบบกระจาย.
  • ตัวดำเนินการที่สามารถทำซ้ำได้ (RepOps): เพื่อให้แน่ใจว่าอุปกรณ์ฮาร์ดแวร์ที่แตกต่างกัน (เช่น Nvidia A100 และ H100) สามารถให้ผลลัพธ์การคำนวณที่สอดคล้องกันได้อย่างสมบูรณ์ Gensyn จึงได้พัฒนาห้องสมุด RepOps ซึ่งทำให้สามารถทำซ้ำได้ตามบิตข้ามแพลตฟอร์มโดยการกำหนดลำดับการดำเนินการทางเลขฐานสิบที่แน่นอน.

การสื่อสาร (Communication): การแลกเปลี่ยนข้อมูลที่มีประสิทธิภาพ

ในสถานการณ์การฝึกอบรมแบบกระจายขนาดใหญ่ การสื่อสารที่มีประสิทธิภาพระหว่างโหนดแต่ละตัวมีความสำคัญอย่างยิ่ง วิธีการขนานข้อมูลแบบดั้งเดิมแม้ว่าจะสามารถลดค่าใช้จ่ายในการสื่อสารได้ในระดับหนึ่ง แต่เนื่องจากต้องการให้แต่ละโหนดเก็บโมเดลทั้งหมด ความสามารถในการขยายตัวจึงถูกจำกัดโดยหน่วยความจำ เพื่อจุดนี้ Gensyn ได้นำเสนอวิธีแก้ปัญหาใหม่ที่ครบถ้วน:

  • SkipPipe – ท่อกระโดดแบบไดนามิกขนาน: เทคโนโลยี SkipPipe ด้วยการเลือกไมโครแบตช์ (microbatch) ที่ผ่านการคำนวณชั้นแบบไดนามิก ทำให้สามารถข้ามบางขั้นตอนในสายการผลิตแบบดั้งเดิม เพื่อลดเวลารอคอยที่ไม่จำเป็น อัลกอริธึมการจัดตารางที่สร้างสรรค์สามารถประเมินความพร้อมใช้งานของแต่ละเส้นทางได้แบบเรียลไทม์ ลดเวลาเงียบของโหนดและลดระยะเวลาในการฝึกอบรมโดยรวมอย่างมาก ตามข้อมูลการทดสอบที่แสดงว่า ในสภาพแวดล้อมการกระจายอำนาจ SkipPipe สามารถลดระยะเวลาการฝึกอบรมได้ประมาณ 55% และในกรณีที่โหนดบางตัวล้มเหลว ประสิทธิภาพของโมเดลจะลดลงเพียงประมาณ 7% เท่านั้น.
  • มาตรฐานการสื่อสารและการทำงานร่วมกันระหว่างโหนด Gensyn สร้างชุดโปรโตคอลการสื่อสารที่คล้ายกับ TCP/IP ทำให้ผู้เข้าร่วมจากทั่วโลกไม่ว่าจะใช้อุปกรณ์ใดสามารถทำการถ่ายโอนข้อมูลและแลกเปลี่ยนข้อมูลได้อย่างมีประสิทธิภาพและราบรื่น มาตรฐานแบบเปิดนี้ให้พื้นฐานเครือข่ายที่มั่นคงสำหรับการฝึกอบรมร่วมกระจายอำนาจ.

การยืนยัน ####: รับรองความไว้วางใจและความปลอดภัย

ในเครือข่ายแบบกระจายอำนาจที่ไม่ต้องการความไว้วางใจ การยืนยันผลลัพธ์การคำนวณที่แต่ละฝ่ายมีส่วนร่วมส่งมานั้นเป็นความท้าทายครั้งใหญ่ Gensyn จึงได้นำเสนอโปรโตคอลการตรวจสอบเฉพาะ โดยมีวัตถุประสงค์เพื่อให้มั่นใจว่าผู้ให้บริการพลังการคำนวณทั้งหมดจะให้ผลลัพธ์การทำงานที่ถูกต้องผ่านกลไกที่มีต้นทุนต่ำและมีประสิทธิภาพสูง:

  • Verde Verification Protocol: Verde เป็นระบบการตรวจสอบแรกที่ออกแบบมาโดยเฉพาะสําหรับการเรียนรู้ของเครื่องที่ทันสมัย หัวใจหลักของเรื่องนี้คือการใช้กลไกการระงับข้อพิพาทที่มีน้ําหนักเบาเพื่อค้นหาขั้นตอนในกระบวนการฝึกอบรมอย่างรวดเร็วซึ่งความขัดแย้งระหว่างแบบจําลองและผู้ตรวจสอบความถูกต้องเกิดขึ้น ซึ่งแตกต่างจากวิธีการตรวจสอบแบบเดิมซึ่งจําเป็นต้องเรียกใช้งานทั้งหมด Verde จะต้องคํานวณการดําเนินการที่ขัดแย้งกันใหม่เท่านั้นซึ่งจะช่วยลดค่าใช้จ่ายในการตรวจสอบได้อย่างมาก
  • การมอบหมายที่อิงการตัดสิน (裁决式委托): เมื่อใช้วิธีนี้ หากผลผลิตของผู้ให้บริการรายใดมีปัญหา ผู้ตรวจสอบสามารถใช้เกมการแก้ไขข้อพิพาทที่มีประสิทธิภาพเพื่อโน้มน้าวผู้ตัดสินที่เป็นกลาง เพื่อให้มั่นใจว่าผู้ตรวจสอบที่ซื่อสัตย์อย่างน้อยหนึ่งรายยังคงมีอยู่ ความถูกต้องของผลลัพธ์ทั้งหมดจะได้รับการประกัน.
  • การเก็บรักษาสถานะกลางของการแฮช: เพื่อสนับสนุนกระบวนการตรวจสอบข้างต้น ผู้เข้าร่วมเพียงแค่ต้องเก็บรักษาและแฮชจุดตรวจสอบการฝึกอบรมกลางบางส่วน แทนที่จะเป็นข้อมูลทั้งหมด ซึ่งช่วยลดการใช้ทรัพยากรและเพิ่มความสามารถในการขยายตัวและความทันเวลาในระบบ.
ดูต้นฉบับ
เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม
  • รางวัล
  • แสดงความคิดเห็น
  • แชร์
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น
  • ปักหมุด