أخبار شبكة العملات، في 21 يناير، وفقًا لـ Quantumbit، بمناسبة مرور عام على إصدار DeepSeek-R1، تم الكشف عن النموذج الجديد «MODEL1». قام DeepSeek بتحديث رمز FlashMLA على GitHub، حيث تم ذكر MODEL1 في 28 مكانًا عبر 114 ملفًا، وظهر كنسخة مختلفة عن V32. من المعروف أن V32 هو DeepSeek-V3.2، ومن المحتمل أن يكون MODEL1 هو الهيكل الجديد. تظهر الاختلافات المحددة في الكود في تخطيط ذاكرة التخزين المؤقت لـ KV، ومعالجة التشتت، وديكود FP8، مع وجود عدة اختلافات في تحسينات الذاكرة.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$3.38Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.38Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.43Kعدد الحائزين:2
    0.05%
  • القيمة السوقية:$3.36Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.36Kعدد الحائزين:1
    0.00%
  • تثبيت