تقرير تقنية 智谱GLM-5V-Turbo: Design2Code يتفوق على Claude Opus4.6، اكتب الكود مباشرة من الصورة الملتقطة

robot
إنشاء الملخص قيد التقدم

موقع بي جيه وورلد يذكر أن ذكاء الاصطناعي من شركة Zhipu AI أصدر تقريرًا تقنيًا عن GLM-5V-Turbo، حيث تم إطلاق النموذج على واجهة برمجة التطبيقات z.ai وOpenRouter في أوائل أبريل. أُعيد إصدار التقرير مع منهجية، ولم يتم فتح مصدر النموذج. يعتبر GLM-5V-Turbo أول نموذج أساسي متعدد الوسائط للبرمجة من Zhipu، يدعم سياقًا يصل إلى 200 ألف، ويمكن دمجه مع أطر عمل الوكيل مثل Claude Code وOpenClaw. منذ مرحلة التدريب المسبق، دمج النموذج الإدراك البصري في جميع عمليات الاستنتاج والتخطيط واستدعاء الأدوات وتنفيذها. يتكون هيكل النموذج من ثلاثة تصاميم رئيسية: المشفر البصري الجديد CogVit، الذي يستخدم SigLip2 وDinoV3 للتدريب بالتقطير الثنائي، ويستخدم 80 مليار مجموعة بيانات ثنائية اللغة من النص والصور باللغة الصينية والإنجليزية لمواءمة التوقعات متعددة الوسائط والمتعددة الرموز (MMTP) من خلال التعلم المقارن، ويستبدل الإدراج المباشر للمدخلات البصرية برمز خاص قابل للتعلم مشترك، مما يقلل من تعقيد الاتصال بين مراحل خط الأنابيب، ويجعل التدريب أكثر استقرارًا، مع تعزيز التعلم المعزز المشترك الذي يغطي مستويات الإدراك والاستنتاج وتنفيذ الوكيل. تظهر نتائج الأداء أن Design2Code حقق 94.8، متفوقًا على Claude Opus الذي حقق 4.6.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت