Rakuten publie le grand modèle linguistique japonais Rakuten AI 3.0, suscitant une controverse en raison de soupçons d'architecture basée sur DeepSeek

Selon les informations de Gate News, le 17 mars, le groupe Lotte a annoncé le lancement de Rakuten AI 3.0, un grand modèle spécialisé en japonais. La société a indiqué que ce modèle surpassait des modèles tels que GPT-4o dans plusieurs tests de référence en japonais, notamment la culture et l’histoire japonaises, ainsi que le respect des instructions, en étant développé à partir de modèles open source combinés à ses propres données bilingues. Cependant, certains internautes ont découvert sur la plateforme X que le fichier config.json de la page Hugging Face de ce projet contenait des éléments tels que "model_type: deepseek_v3". De plus, lorsque ce modèle répondait à des questions connexes, ses positions semblaient clairement pencher en faveur de la Chine plutôt que du Japon. Cette découverte a suscité des discussions parmi les internautes sur le fait de savoir si ce modèle était basé sur DeepSeek et sur la proportion de technologies japonaises auto-développées qu’il contenait.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire