مرور عام على مرور سنة على إصدار DeepSeek-R1 وكشف النقاب عن النموذج الجديد «MODEL1»

BlockBeats أخبار، 21 يناير، وفقًا لـ ، بمناسبة مرور سنة على إصدار DeepSeek-R1، تم الكشف عن النموذج الجديد «MODEL1». قام DeepSeek بتحديث رمز FlashMLA على GitHub، حيث تم ذكر MODEL1 في 28 موضعًا عبر 114 ملفًا، ويظهر بشكل مختلف عن V32. من المعروف أن V32 هو DeepSeek-V3.2، ومن المحتمل أن يكون MODEL1 هو الهيكل الجديد. تظهر الاختلافات المحددة في الكود في تخطيط ذاكرة التخزين المؤقت KV، ومعالجة التشتت، وديكود FP8، وهناك عدة اختلافات في تحسين الذاكرة.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات