Co-fondateur d'AMI Labs, Xie Saining : Les LLM sont dans une certaine mesure « anti-Bitter Lesson », le modèle mondial est l'avenir

Gate News, le 16 mars, la société de modèles mondiaux AMI Labs, qui a récemment levé 1,03 milliard de dollars lors d’un tour de financement seed, a vu son co-fondateur et directeur scientifique, ainsi que co-auteur de l’article sur Diffusion Transformer (DiT), Xie Saining, accorder pour la première fois une longue interview publique. Xie Saining a critiqué de manière systématique la voie actuelle de l’IA centrée sur les grands modèles de langage, estimant que les LLM ne représentent pas la réussite du « Bitter Lesson » proposée par Richard Sutton, voire qu’ils sont « en quelque sorte l’antithèse du Bitter Lesson ». Il a souligné que le langage lui-même est une structure hautement raffinée de la civilisation humaine, équivalant à une « raccourci », et qu’une dépendance excessive limiterait l’apprentissage de l’IA du monde réel. Il a distingué le modèle mondial du modèle linguistique : le modèle linguistique prédit le « prochain token », tandis que le modèle mondial, basé sur l’action, prédit le « prochain état », permettant d’anticiper les conséquences des comportements lors de la phase de raisonnement, ce qui rend l’intelligence plus sûre et contrôlable. Il a également déclaré que « l’AGI est un faux problème », soulignant qu’il est plus difficile de créer un agent capable de survivre dans le monde réel que de résoudre des concours de mathématiques ou d’écrire du code. Xie Saining a aussi révélé avoir refusé à deux reprises l’invitation d’Ilya Sutskever : en 2018, il a abandonné l’idée de rejoindre OpenAI pour choisir Meta FAIR, et en 2024, il a poliment décliné l’offre de sa nouvelle société SSI, en raison de divergences sur les approches multimodale et visuelle. Il a indiqué qu’AMI Labs évitait délibérément d’avoir un bureau dans la Silicon Valley, car « la Silicon Valley est déjà profondément engagée dans la voie des LLM ». Le siège de l’entreprise est situé à Paris, et elle collecte des données du monde réel via des partenaires mondiaux. Il pense que le paradigme de formation de l’IA évolue du « téléchargement d’Internet » vers le « téléchargement de l’humain », avec à court terme comme scénarios d’application des lunettes intelligentes et des robots.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire