كاشف Cursor عن طريقة التدريب "التمهيد الذاتي": استخدام Composer القديم لإعداد بيئة لنموذج جديد، وارتفاع أداء Terminal-Bench بمقدار 14 نقطة

robot
إنشاء الملخص قيد التقدم

وفقًا لمراقبة Beating، كشفت Cursor عن تقنية تدريب لسلسلة نماذج Composer: استخدام النموذج السابق لبناء بيئة تشغيل تلقائيًا لتعزيز التعلم (RL) للجيل التالي. عند تدريب Composer 2، استخدمت Cursor Composer 1.5 لإنجاز هذه المهمة، وأطلقت عليها اسم autoinstall. يتطلب تدريب RL بيئة برمجية قابلة للتشغيل. إذا لم تكن البيئة معدة بشكل جيد، فإن النموذج يضيع الوقت في تصحيح الأخطاء، ولا يتعلم شيئًا؛ وفي الحالات القصوى، قد تتعطل البيئة تمامًا، وتُهدر قوة الحوسبة على التدريب. يحل autoinstall هذه المشكلة على خطوتين: الخطوة الأولى، يقرأ وكيل (agent) وثائق ومواصفات قاعدة البيانات، ويقترح 10 أوامر للتحقق والنتائج المتوقعة؛ الخطوة الثانية، يأخذ وكيل آخر 3 أوامر من بين تلك الأوامر، ويبدأ من الصفر في إعداد البيئة حتى يتم تشغيل الأوامر بنجاح. يُسمح بأقصى 5 محاولات في الخطوة الثانية، وإذا فشلت جميعها، يتم التخلي عن تلك البيئة. أثناء إعداد البيئة، يقوم الوكيل بشكل نشط بتعويض الاعتمادات المفقودة: إنشاء جداول قاعدة البيانات الوهمية، إعداد تكوين MinIO كبديل لـ S3، تشغيل حاويات Docker لخدمة جانبية، وحتى إنشاء صور مؤقتة. في منشور مدونة، تم استخدام مشروع blockchain مثل celo-org/celo-monorepo كمثال لعرض العملية الكاملة، حيث فشل الوكيل في إعداد البيئة في الجولة الأولى، ثم أنشأ مستخدمين وهميين لتجاوز التحقق في الجولة الثانية، وتمكن في النهاية من تشغيل الاختبار. حقق Composer 2 درجة 61.7% في اختبار Terminal-Bench (مقياس قدرة النموذج على إعداد بيئة التطوير)، متفوقًا بنحو 14 نقطة على Composer 1.5 الذي حصل على 47.9%. وأكدت Cursor أن الخطط المستقبلية تتضمن مشاركة النسخة القديمة من Composer في مزيد من مراحل التدريب، بما في ذلك المعالجة المسبقة للبيانات، وإدارة التشغيل، وتحسين الهيكلية.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت