DeepSeek最新发布的论文透露了一个有意思的技术方向。核心思路是把大语言模型里的长期记忆部分从模型权重中独立出来,转而存储到内存硬件中,这样做能显著释放显存压力。论文中提到的n-gram技术方案就是基于这个思路——通过外部内存存储长期依赖信息,而不是依赖模型内部参数。



从硬件角度看,这种架构转变意味着什么?内存的需求量会大幅上升。随着大模型向这个方向演进,DDR5内存的市场需求可能进入新的增长周期。镁光作为主流内存供应商,长期来看是受益者。

从投资角度考虑,DDR5内存的价格压力可能还会持续走高。如果这类技术方案真的落地推广,今年翻倍的预期并不过分——取决于模型训练和部署的实际进度。
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim