OpenClaw sáng lập chia sẻ xếp hạng tỷ lệ phù hợp của mô hình AI, minimax-m2.1 và kimi-k2.5 nội địa xếp thứ 2, 3.

Tin tức Gate, ngày 8 tháng 3, nhà sáng lập OpenClaw (khung phát triển đại lý AI) Peter Steinberger đã chia sẻ kết quả benchmark của tổ chức thứ ba PinchBench, đánh giá hiệu suất của các mô hình ngôn ngữ lớn AI trong nhiệm vụ đại lý OpenClaw. Kết quả cho thấy Gemini 3 Flash đạt tỷ lệ thành công trong xử lý nhiệm vụ OpenClaw là 95,1%, đứng đầu bảng, trong khi các mô hình nội địa minimax-m2.1 và kimi-k2.5 lần lượt đạt 93,6% và 93,4%, xếp thứ 2 và thứ 3. Claude Sonnet 4.5 có tỷ lệ thành công là 92,7%, GPT-4o là 85,2%.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận