深潮 TechFlow أخبار، 21 يناير، وفقًا لبيانات جينشتي، بمناسبة مرور عام على إصدار DeepSeek-R1، تم الكشف عن النموذج الجديد "MODEL1". قام DeepSeek بتحديث رمز FlashMLA على GitHub، حيث تم ذكر MODEL1 في 28 مكانًا عبر 114 ملفًا، وظهر جنبًا إلى جنب مع V32 كنموذج مختلف. من المعروف أن V32 هو DeepSeek-V3.2، ومن المحتمل أن يكون MODEL1 هو الهيكل الجديد. تظهر الاختلافات المحددة في الكود في تنظيم ذاكرة التخزين المؤقت KV، ومعالجة التشتت، وفك ترميز FP8، وهناك العديد من الاختلافات في تحسين الذاكرة. (الكمية الكمومية)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$3.39Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.38Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.38Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.43Kعدد الحائزين:2
    0.05%
  • القيمة السوقية:$3.36Kعدد الحائزين:1
    0.00%
  • تثبيت