A recente publicação do artigo da DeepSeek revelou uma direção tecnológica interessante. A ideia central é separar a memória de longo prazo dos grandes modelos de linguagem dos pesos do modelo, transferindo-a para hardware de memória, o que pode aliviar significativamente a pressão sobre a VRAM. A solução técnica baseada em n-gramas mencionada no artigo é exatamente essa — armazenar informações de dependência de longo prazo em memória externa, em vez de depender dos parâmetros internos do modelo.



Do ponto de vista de hardware, que impacto essa mudança de arquitetura pode ter? A demanda por memória aumentará consideravelmente. À medida que os grandes modelos evoluem nessa direção, a demanda de mercado por memória DDR5 pode entrar em um novo ciclo de crescimento. A Micron, como fornecedora principal de memória, é uma beneficiária a longo prazo.

Do ponto de vista de investimento, a pressão sobre os preços da memória DDR5 pode continuar a subir. Se essa tecnologia realmente for implementada e difundida, não é exagero esperar que os preços dobrem neste ano — tudo depende do progresso real no treinamento e implantação dos modelos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar

Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt