أطلقت شركة Rakuten نموذج Rakuten AI 3.0، وتُظهر ملفات التكوين أن الهيكل الأساسي هو DeepSeek V3

أخبار Gate، في 17 مارس، أطلقت مجموعة ليتان اليوم Rakuten AI 3.0 باسم "أكبر نموذج ذكاء اصطناعي عالي الأداء في اليابان"، وهو مفتوح المصدر بموجب ترخيص Apache 2.0. يعتمد النموذج على بنية MoE (خبير مختلط) ويحتوي على 671 مليار معلمة، ويشغل 37 مليار خلال كل استنتاج، ويحتوي على نافذة سياق تبلغ 128 ألف، ومُحسن للغة اليابانية، وتفوق على GPT-4o في العديد من الاختبارات القياسية للغة اليابانية. يُعد النموذج نتيجة لمشروع GENIAC الذي يشارك فيه وزارة الاقتصاد والصناعة اليابانية ووكالة تطوير تكنولوجيا الطاقة الجديدة (NEDO)، وقد قدمت الحكومة اليابانية جزءًا من تمويل الحوسبة لتدريبه. وصفت ليتان في إعلانها النموذج الأساسي بأنه "نتيجة للاستفادة الكاملة من أفضل نتائج المجتمع المفتوح"، دون ذكر اسم النموذج المحدد. وفورًا، قام المجتمع بمراجعة ملفات النموذج المنشورة على منصة HuggingFace، ووجد أن ملف config.json يوضح بوضوح أن model_type هو deepseek_v3 وarchitecture هو DeepseekV3ForCausalLM، وأن المعلمات الإجمالية 671 مليار، و37 مليار نشط، ونافذة السياق 128 ألف، وهو مطابق تمامًا لنموذج DeepSeek V3، مما يشير إلى أن النموذج تم تعديله بشكل دقيق على أساس DeepSeek V3 باستخدام بيانات باللغة اليابانية.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات