Mạng thử nghiệm Gensyn đã được ra mắt, làm thế nào để làm cho việc đào tạo AI hiệu quả hơn và phi tập trung hơn?

robot
Đang tạo bản tóm tắt

Gensyn Testnet ra mắt, làm thế nào để AI huấn luyện hiệu quả hơn và Phi tập trung hơn?

Tác giả: Zen, PANews

AI là mảng phân khúc được quan tâm nhất trong ngành công nghiệp tiền mã hóa hiện nay, trong đó mạng lưới tính toán AI phi tập trung Gensyn được a16z dẫn dắt đầu tư với tổng quy mô huy động đạt 50 triệu USD chắc chắn là một dự án cạnh tranh. Gần đây, Gensyn đã chính thức ra mắt testnet, mặc dù muộn hơn một năm so với thời gian dự kiến, nhưng với việc testnet được ra mắt, nó cuối cùng đã bước vào giai đoạn mới.

Là một Ethereum Rollup tùy chỉnh được thiết kế riêng cho học máy, mạng thử nghiệm Gensyn tích hợp khung thực thi, xác minh và giao tiếp ngoài chuỗi, nhằm cung cấp cho hệ thống AI phi tập trung các chức năng chính như danh tính bền vững, theo dõi tham gia, duy trì quyền sở hữu, thanh toán, phối hợp thực thi từ xa, xác minh không tín nhiệm, ghi chép quá trình đào tạo và huy động vốn cho các nhiệm vụ đào tạo quy mô lớn.

Giai đoạn đầu tiên của Testnet tập trung vào việc theo dõi sự tham gia trong RL Swarm. RL Swarm là một ứng dụng dành cho huấn luyện tăng cường hợp tác sau đào tạo, các nút của nó có thể được liên kết với danh tính trên chuỗi, từ đó đảm bảo rằng đóng góp của mỗi nút tham gia được ghi lại chính xác.

RL Swarm:Chức năng cốt lõi và huấn luyện hợp tác

Trong mạng thử nghiệm Gensyn, RL Swarm, như một ứng dụng cốt lõi, là một hệ thống huấn luyện mô hình hợp tác dựa trên mạng phi tập trung. Khác với việc huấn luyện độc lập mô hình đơn lẻ truyền thống, RL Swarm cho phép nhiều mô hình giao tiếp, phê bình và cải thiện lẫn nhau trong mạng, từ đó nâng cao hiệu suất tổng thể. Ý tưởng cốt lõi của nó là "trí tuệ tập thể", tức là thông qua sự hợp tác và phản hồi giữa các mô hình nút, đạt được hiệu quả huấn luyện hiệu quả hơn.

Có thể hiểu đơn giản rằng, các mô hình như DeepSeek-R1 trong quá trình huấn luyện suy diễn có thể nâng cao hiệu suất suy diễn thông qua tự phê bình, trong khi RL Swarm đã mở rộng cơ chế này vào trong một nhóm nhiều mô hình, đạt được hiệu quả "nhiều người góp gỗ lửa càng cao."

Dựa trên hệ thống RL Swarm, mô hình không chỉ phụ thuộc vào phản hồi của chính nó, mà còn thông qua việc quan sát và đánh giá hiệu suất của các mô hình khác, xác định những thiếu sót của bản thân và thực hiện tối ưu hóa. Mỗi nút mô hình tham gia vào Swarm đều tham gia vào một quá trình ba giai đoạn: đầu tiên hoàn thành độc lập vấn đề và đưa ra ý tưởng cùng câu trả lời, sau đó xem câu trả lời của các nút khác và cung cấp phản hồi, cuối cùng mô hình bỏ phiếu chọn ra giải pháp tối ưu và điều chỉnh đầu ra của mình theo đó. Cơ chế hợp tác này không chỉ nâng cao hiệu suất của từng mô hình mà còn thúc đẩy sự tiến hóa của toàn bộ mô hình nhóm. Các mô hình tham gia vào Swarm sau khi rời đi vẫn có thể giữ lại trọng số địa phương đã được cải thiện, thu được lợi ích thực tế.

Gensyn Testnet ra mắt, làm thế nào để việc đào tạo AI hiệu quả hơn và phi tập trung hơn?

Ngoài ra, Gensyn có mã nguồn mở RL Swarm, cho phép bất kỳ ai chạy một nút, bắt đầu hoặc tham gia một Swarm hiện có mà không cần sự cho phép. Giao tiếp cơ bản của Swarm sử dụng giao thức tin đồn do Hivemind cung cấp, hỗ trợ nhắn tin phi tập trung và chia sẻ tín hiệu học tập giữa các mô hình. Cho dù đó là máy tính xách tay gia đình hay GPU đám mây, bạn có thể tham gia đào tạo cộng tác bằng cách tham gia nút RL Swarm.

Cơ sở hạ tầng ba trụ cột: thực thi, truyền thông và xác minh

Hiện tại RL Swarm vẫn chỉ là một bản trình diễn thử nghiệm, nó thể hiện một phương pháp học máy quy mô lớn, có thể mở rộng, chứ không phải hình thức sản phẩm cuối cùng. Trong bốn năm qua, công việc cốt lõi của Gensyn thực chất là xây dựng cơ sở hạ tầng nền tảng, sau khi phát hành Testnet đã bước vào giai đoạn v0.1, có thể vận hành thực tế. Theo giới thiệu chính thức, kiến trúc tổng thể của Gensyn được chia thành ba phần: thực thi, truyền thông và xác minh.

Thực hiện (Execution): Tính nhất quán và sức mạnh tính toán phân tán

Gensyn cho rằng, tương lai của học máy không còn bị giới hạn bởi các mô hình đơn thể truyền thống, mà được tạo thành từ các tham số phân mảnh phân bố trên các thiết bị toàn cầu. Để đạt được mục tiêu này, đội ngũ Gensyn đã phát triển một kiến trúc thực thi cơ sở đảm bảo tính nhất quán giữa các thiết bị. Các công nghệ chủ chốt trong đó bao gồm:

  • Lưu trữ và huấn luyện tham số phân phối: Bằng cách chia nhỏ mô hình quy mô lớn thành nhiều khối tham số và phân phối chúng trên các thiết bị khác nhau, Gensyn đã đạt được việc triển khai mô hình phân mảnh, giảm yêu cầu về bộ nhớ cho từng nút.
  • Huấn luyện sau đào tạo học tăng cường (RL Post-Training): Nghiên cứu cho thấy, khi mô hình được huấn luyện theo cách tập thể, giao tiếp và phê bình câu trả lời của nhau, hiệu suất học tập tổng thể sẽ được cải thiện rõ rệt. Gensyn đã sử dụng RL Swarm để minh họa khái niệm này, cho phép mô hình tiến bộ nhanh chóng trong các cuộc thảo luận tập thể, từ đó xác minh thêm tính hiệu quả của việc thực hiện phân tán.
  • Toán tử có thể tái hiện (RepOps): Để đảm bảo rằng các phần cứng khác nhau (như Nvidia A100 và H100) có thể đưa ra kết quả tính toán hoàn toàn nhất quán, Gensyn đã phát triển thư viện RepOps, thông qua việc cố định thứ tự thực hiện phép toán dấu phẩy động, đã đạt được khả năng tái hiện từng bit trên các nền tảng khác nhau.

Giao tiếp (Communication): Trao đổi thông tin hiệu quả

Trong các kịch bản đào tạo phân tán quy mô lớn, việc giao tiếp hiệu quả giữa các nút là cực kỳ quan trọng. Mặc dù các phương pháp song song dữ liệu truyền thống có thể giảm thiểu chi phí giao tiếp ở một mức độ nhất định, nhưng do yêu cầu mỗi nút phải lưu trữ mô hình đầy đủ, khả năng mở rộng của nó bị hạn chế bởi bộ nhớ. Để giải quyết vấn đề này, Gensyn đã đề xuất một giải pháp hoàn toàn mới:

  • SkipPipe – Ống nhảy động song song: Công nghệ SkipPipe bằng cách lựa chọn động các vi lô (microbatch) đi qua các lớp tính toán, đã bỏ qua một số giai đoạn trong ống dẫn truyền thống, từ đó giảm thiểu thời gian chờ đợi không cần thiết. Thuật toán lập lịch sáng tạo của nó có khả năng đánh giá tính khả dụng của các đường đi trong thời gian thực, vừa giảm thời gian nhàn rỗi của nút, vừa rút ngắn đáng kể tổng thời gian huấn luyện. Dữ liệu thử nghiệm cho thấy, trong môi trường phi tập trung, SkipPipe có thể giảm thời gian huấn luyện khoảng 55%, và trong trường hợp một số nút bị lỗi, hiệu suất mô hình chỉ giảm khoảng 7%.
  • Tiêu chuẩn giao tiếp và hợp tác đa nút Gensyn xây dựng một bộ giao thức giao tiếp tương tự như TCP/IP, cho phép người tham gia từ khắp nơi trên thế giới, bất kể thiết bị nào họ sử dụng, có thể truyền tải dữ liệu và tương tác thông tin một cách hiệu quả, liền mạch. Tiêu chuẩn mở này cung cấp nền tảng mạng vững chắc cho việc đào tạo hợp tác phân tán.

Xác minh (Verification): Đảm bảo sự tin cậy và an toàn

Trong một mạng lưới phân phối không cần tin cậy, việc xác nhận tính chính xác và hợp lệ của kết quả tính toán do các bên tham gia cung cấp là một thách thức lớn. Gensyn đã giới thiệu một giao thức xác thực chuyên dụng nhằm đảm bảo rằng tất cả các nhà cung cấp sức mạnh tính toán cung cấp kết quả công việc chính xác thông qua cơ chế hiệu quả và chi phí thấp:

  • Giao thức xác thực Verde: Verde là hệ thống xác thực đầu tiên được thiết kế đặc biệt cho việc học máy hiện đại. Cốt lõi của nó là sử dụng cơ chế giải quyết tranh chấp nhẹ nhàng, nhanh chóng xác định bước mà mô hình và người xác thực phát sinh sự khác biệt trong quá trình đào tạo. Khác với phương pháp xác thực truyền thống cần phải chạy lại toàn bộ nhiệm vụ, Verde chỉ cần tính toán lại các thao tác tranh chấp, do đó giảm đáng kể chi phí xác thực.
  • Ủy quyền trọng tài: Với cách tiếp cận này, nếu có vấn đề với đầu ra của nhà cung cấp, trình xác thực có thể thuyết phục trọng tài trung lập thông qua một trò chơi giải quyết tranh chấp hiệu quả để đảm bảo rằng toàn bộ tính toán là chính xác nếu có ít nhất một nút trung thực.
  • Lưu trữ và băm trạng thái trung gian: Để hỗ trợ quá trình xác minh nêu trên, các bên tham gia chỉ cần lưu trữ và băm một phần các điểm kiểm tra đào tạo trung gian, thay vì toàn bộ dữ liệu, điều này không chỉ giảm thiểu việc sử dụng tài nguyên mà còn nâng cao khả năng mở rộng và tính thời gian thực của hệ thống.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)