Gate 广場「創作者認證激勵計畫」優質創作者持續招募中!
立即加入,發布優質內容,參與活動即可瓜分月度 $10,000+ 創作獎勵!
認證申請步驟:
1️⃣ 打開 App 首頁底部【廣場】 → 點擊右上角頭像進入個人首頁
2️⃣ 點擊頭像右下角【申請認證】,提交申請等待審核
立即報名:https://www.gate.com/questionnaire/7159
豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000 的豐厚獎勵等你拿!
活動詳情:https://www.gate.com/announcements/article/47889
深潮 TechFlow 消息,1 月 21 日,据金十数据报道,DeepSeek-R1發布一周年之際,新模型“MODEL1”曝光。DeepSeek在GitHub更新FlashMLA代碼,橫跨114個文件中有28處提到MODEL1,與V32作為不同的模型出現。已知V32是DeepSeek-V3.2,MODEL1很可能是新的架構。代碼中的具體差異體現在KV緩存佈局、稀疏性處理和FP8解碼方面,在內存優化上有多處不同。(量子位)