Nghiên cứu: Tệp AGENTS.md giúp rút ngắn thời gian chạy của AI lập trình Agent 29% và giảm 17% số token đầu ra

Theo tin tức BlockBeats vào ngày 3 tháng 3, theo 1M AI News, các nhóm nghiên cứu từ Đại học Quản lý Singapore, Đại học Heidelberg, Đại học Bamberg và King's College London đã xuất bản một bài báo trên arXiv, lần đầu tiên đánh giá định lượng tác động của hồ sơ cấp kho AGENTS.md đối với hiệu quả của các tác nhân lập trình AI. AGENTS.md là một tệp hướng dẫn được lưu trữ trong thư mục gốc của kho lưu trữ mã để giải thích kiến trúc dự án, lệnh xây dựng, thông số kỹ thuật mã hóa và các ràng buộc hoạt động đối với Tác nhân AI, tương tự như CLAUDE.md của Anthropic Claude Code và copilot-instructions.md của GitHub Copilot và đã được hơn 60.000 kho lưu trữ GitHub áp dụng.

Nhóm nghiên cứu đã tiến hành các thử nghiệm ghép nối bằng cách sử dụng OpenAI Codex (gpt-5.2-codex) trên 124 PR hợp nhất trên 10 kho lưu trữ (không có kho nào có hơn 100 dòng thay đổi mã), chạy trong cả hai điều kiện AGENTS.md. Kết quả cho thấy AGENTS.md thời gian chạy trung bình giảm từ 98,57 giây xuống 70,34 giây (giảm 28,64%) và mã thông báo đầu ra trung bình giảm từ 2.925 xuống 2.440 (giảm 16,58%) mà không có sự khác biệt đáng kể về hành vi hoàn thành nhiệm vụ (kiểm tra xếp hạng có chữ ký Wilcoxon, p). < 0.05)。

Các nhà nghiên cứu chỉ ra rằng AGENTS.md đã thay đổi hướng dẫn tác nhân từ "lời nhắc tạm thời" thành "cấu hình tạo tác được phiên bản, có thể xem xét và hợp tác duy trì", và đề nghị các nhóm phát triển kết hợp nó vào kho lưu trữ như một thực tiễn tiêu chuẩn. Về hạn chế, nghiên cứu chỉ thử nghiệm tác nhân đơn lẻ OpenAI Codex và mẫu chỉ giới hạn ở PR quy mô nhỏ và không tiến hành đánh giá tính đúng đắn của mã toàn diện.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận