العقود الآجلة
وصول إلى مئات العقود الدائمة
CFD
الذهب
منصّة واحدة للأصول التقليدية العالمية
الخیارات المتاحة
Hot
تداول خيارات الفانيلا على الطريقة الأوروبية
الحساب الموحد
زيادة كفاءة رأس المال إلى أقصى حد
التداول التجريبي
مقدمة حول تداول العقود الآجلة
استعد لتداول العقود الآجلة
أحداث مستقبلية
"انضم إلى الفعاليات لكسب المكافآت "
التداول التجريبي
استخدم الأموال الافتراضية لتجربة التداول بدون مخاطر
إطلاق
CandyDrop
اجمع الحلوى لتحصل على توزيعات مجانية.
منصة الإطلاق
-التخزين السريع، واربح رموزًا مميزة جديدة محتملة!
HODLer Airdrop
احتفظ بـ GT واحصل على توزيعات مجانية ضخمة مجانًا
Pre-IPOs
افتح الوصول الكامل إلى الاكتتابات العامة للأسهم العالمية
نقاط Alpha
تداول الأصول على السلسلة واكسب التوزيعات المجانية
نقاط العقود الآجلة
اكسب نقاط العقود الآجلة وطالب بمكافآت التوزيع المجاني
عروض ترويجية
AI
Gate AI
شريكك الذكي الشامل في الذكاء الاصطناعي
Gate AI Bot
استخدم Gate AI مباشرة في تطبيقك الاجتماعي
GateClaw
Gate الأزرق، جاهز للاستخدام
Gate for AI Agent
البنية التحتية للذكاء الاصطناعي، Gate MCP، Skills و CLI
Gate Skills Hub
أكثر من 10 آلاف مهارة
من المكتب إلى التداول، مكتبة المهارات الشاملة تجعل الذكاء الاصطناعي أكثر فعالية
GateRouter
ختر بذكاء من أكثر من 40 نموذج ذكاء اصطناعي، بدون أي رسوم إضافية 0%
تقرير تقنية 智谱GLM-5V-Turbo: Design2Code يتجاوز Claude Opus4.6، اكتب الكود مباشرة من الصورة الملتقطة
وفقًا لمراقبة Beating، أصدرت شركة Zhipu AI تقريرًا تقنيًا عن GLM-5V-Turbo. النموذج تم إطلاقه بالفعل في أوائل أبريل عبر واجهة برمجة التطبيقات Z.ai و OpenRouter، وهذه المرة هو نشر منهجية الكشف، ولم يتم إصدار النموذج كمصدر مفتوح. يعتبر GLM-5V-Turbo أول نموذج برمجة متعدد الوسائط من Zhipu، يدعم سياقًا يصل إلى 200 ألف، ويمكن دمجه مع أطر عمل الوكيل مثل Claude Code و OpenClaw. بخلاف العديد من الطرق التي تعتبر الرؤية ملحقًا لنموذج اللغة، يدمج هذا النموذج الإدراك البصري في جميع مراحل الاستدلال والتخطيط واستدعاء الأدوات وتنفيذها منذ مرحلة التدريب المسبق.
يتكون هيكل النموذج من ثلاثة تصاميم رئيسية. الأولى هي المشفر البصري الجديد CogViT، الذي يتم تدريبه مسبقًا بواسطة تقنيتي SigLIP2 و DINOv3 كمدرسين مزدوجين، ثم يتم محاذاته باستخدام تعلم المقارنة مع 8 مليارات من البيانات النصية والصور ثنائية اللغة الصينية والإنجليزية. الثانية هي التنبؤ متعدد الوسائط والمتعدد الرموز (MMTP)، حيث يتم استبدال الإدخال المباشر للصور بواسطة رمز خاص قابل للتعلم <|image|>، مما يقلل من تعقيد التواصل بين مراحل خط الأنابيب ويجعل التدريب أكثر استقرارًا. الثالثة هي التعلم المعزز المشترك لأكثر من 30 مهمة، والتي تغطي مستويات الإدراك والاستدلال وتنفيذ الوكيل.
التحسينات خلال مرحلة التعلم المعزز تتوزع على نطاق واسع: تحديد المواقع في الصور ثنائية الأبعاد +4.8%، فهم الفيديو +5.6%، تحديد المواقع ثلاثية الأبعاد +7.7%، التعرف على النصوص البصرية +4.2%، فهم الرسوم البيانية +7.7%، وكيل واجهة المستخدم الرسومية (OSWorld) +4.9%، استدعاء أدوات البحث متعددة الوسائط +3.5%. وأشار الفريق في الورقة البحثية إلى أن التعلم المعزز متعدد المهام يختلف عن التدخل عبر المجالات الشائع في Fine-Tuning، حيث يمكن لكل قدرة أن تتطور بشكل مستقر معًا، وحتى أن أنماط الاستدلال التي تم تعلمها في مجال معين يمكن أن تنتقل إلى مجالات أخرى.
أما عن نتائج الأداء المحددة: تصميم2كود 94.8، متفوقًا على Claude Opus بمقدار 4.6؛ OSWorld 62.3، AndroidWorld 75.7؛ البحث متعدد الوسائط MMSearch 72.9، BrowseComp-VL 51.9؛ البرمجة النصية البحتة على خلفية CC-Bench-V2 (22.8)، الواجهة الأمامية (68.4)، واستكشاف مستودعات الكود (72.2) تفوقت على قاعدة GLM-5-Turbo النصية البحتة. حصل MMSearch-Plus على 30.0، بزيادة تقارب 8 أضعاف عن الجيل السابق GLM-4.6V؛ كما حقق معيار البحث العميق البصري الذي تم تطويره داخليًا ImageMining نتيجة 30.7.