DeepSeek nouvelle publication propose le système de raisonnement DualPath, la capacité de traitement des agents presque doublée

PANews 27 février – Alors que l'industrie attend avec impatience la nouvelle génération de modèle phare DeepSeek V4, l'équipe DeepSeek a discrètement publié un nouveau papier académique. Ce nouveau document présente un système d'inférence innovant nommé DualPath, spécialement optimisé pour la performance d'inférence des grands modèles (LLM) sous charge d'agents intelligents. En introduisant un mécanisme de « lecture double voie du KV-Cache (semblable à un cache mémoire) », il redistribue la charge du réseau de stockage, augmentant le débit d'inférence hors ligne jusqu'à 1,87 fois, et le nombre moyen d'agents en fonctionnement par seconde en service en ligne de 1,96 fois. Dans l'introduction, le papier mentionne que les grands modèles évoluent rapidement, passant de simples chatbots à inférence autonome à des systèmes d'agents capables de planifier, d'utiliser des outils et de résoudre des tâches complexes via des interactions multi-tours. Cette transformation paradigmique entraîne une révolution majeure dans la charge d'inférence des grands modèles : passant d'une interaction humain-grand modèle à une interaction humain-grand modèle-environnement, pouvant atteindre plusieurs dizaines voire centaines de tours.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire