DeepSeek最新发布的论文透露了一个有意思的技术方向。核心思路是把大语言模型里的长期记忆部分从模型权重中独立出来,转而存储到内存硬件中,这样做能显著释放显存压力。论文中提到的n-gram技术方案就是基于这个思路——通过外部内存存储长期依赖信息,而不是依赖模型内部参数。



从硬件角度看,这种架构转变意味着什么?内存的需求量会大幅上升。随着大模型向这个方向演进,DDR5内存的市场需求可能进入新的增长周期。镁光作为主流内存供应商,长期来看是受益者。

从投资角度考虑,DDR5内存的价格压力可能还会持续走高。如果这类技术方案真的落地推广,今年翻倍的预期并不过分——取决于模型训练和部署的实际进度。
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt