Dans un contexte mondial de plus en plus marqué par la concurrence technologique entre les États-Unis et la Chine, Ant Group, contrôlé par Alibaba, prend des mesures significatives pour réduire sa dépendance aux puces américaines et contenir les coûts dans le développement des modèles d'intelligence artificielle (AI).
Selon des sources proches de l'entreprise, Ant compte sur des semiconduttori cinesi pour former ses modèles linguistiques avancés, en utilisant une approche qui promet de révolutionner la manière dont l'IA est produite dans le pays asiatique.
Point de tournant stratégique dans l'entraînement des modèles d'IA pour Ant Group
Au cours des derniers mois, Ant Group a adopté des puces fournies par des entreprises locales, y compris des entités liées à Alibaba et Huawei Technologies, pour entraîner ses modèles d’IA à l’aide de la technique Mixture of Experts (MoE)
Cette approche, de plus en plus répandue parmi les chercheurs, permet de diviser efficacement les tâches entre différents "experti" au sein du modèle, améliorant ainsi son efficacité computationnelle.
Les sources assurent que les résultats de ces modèles ne sont pas seulement comparables à ceux obtenus avec les puces Nvidia H800. Cependant, dans certains tests, ils auraient même dépassé la performance des modèles développés par Meta.
Bien que Bloomberg News n'ait pas vérifié de manière indépendante ces performances, les données indiquent des progrès significatifs dans la tentative de la Chine de réduire ses coûts opérationnels et de diminuer sa dépendance technologique.
La technique MoE est inspirée par le principe de délégation spécialisée : chaque sous-module du modèle est responsable d'une portion spécifique du traitement, permettant une plus grande évolutivité et une efficacité par rapport aux approches traditionnelles.
En plus d’Ant Group, Google et la start-up chinoise de Hangzhou DeepSeek utilisent également cette méthodologie.
Ant a souligné son engagement en faveur de la diffusion scientifique en publiant un article qui met l’accent sur l’objectif de mise à l’échelle des modèles sans l’utilisation de GPU haut de gamme
Cette approche devient cruciale pour les entreprises qui, en raison des coûts élevés, ne peuvent pas se permettre d'utiliser en continu du matériel haute performance.
Chine contre États-Unis : puces locales contre GPU américains
L'initiative d'Ant s'inscrit dans un contexte géopolitique où les entreprises technologiques chinoises tentent de contourner les restrictions américaines sur l'exportation de puces avancées, telles que la Nvidia H800.
Même s’il ne s’agit pas de la puce la plus avancée du marché, le H800 reste l’un des GPU les plus puissants disponibles en Chine.
Bien qu'Ant Group maintienne toujours une partie de sa production d'IA basée sur des puces Nvidia, l'entreprise s'oriente progressivement vers des alternatives plus économiques et facilement accessibles. Comme celles proposées par AMD et des fabricants chinois.
Ce choix stratégique marque une rupture avec la vision du PDG d'Nvidia, Jensen Huang, selon laquelle les entreprises continueront à exiger de plus en plus de puissance de calcul.
Selon Huang, les investissements des clients ne diminueront pas, même avec l'émergence de modèles plus efficaces comme DeepSeek R1. Cela montre donc un contraste clair avec la philosophie adoptée par Ant.
L'un des points forts de l'analyse d'Ant concerne la réduction significative du coût de formation des modèles d'IA.
Selon le document publié, former un modèle sur un trillion de tokens, les unités de base utilisées pour l'apprentissage, coûte traditionnellement environ 6,35 millions de yuans ( environ 880 000 dollars ).
En utilisant des puces moins performantes, optimisées cependant pour la méthode MoE, le coût a été réduit à 5,1 millions de yuans.
Une économie non marginale, qui pourrait révolutionner l'accessibilité à l'intelligence artificielle, en particulier pour les startups et les secteurs industriels émergents.
Les modèles développés, Ling-Lite et Ling-Plus, ont été conçus pour des applications dans des contextes tels que la santé et la finance, deux domaines où la puissance de l'IA peut offrir des solutions concrètes et immédiates.
Précisément dans le domaine de la santé, Ant a récemment acquis Haodf.com, l'une des principales plateformes médicales en ligne en Chine. Confirmant ainsi son intérêt pour l'expansion de l'offre de solutions basées sur l'intelligence artificielle.
Parmi les services existants de l'entreprise figurent également Zhixiaobao, un assistant virtuel, et la plateforme de conseil financier Maxiaocai.
“html Ouverture et avenir de l'intelligence artificielle chinoise “
Un autre point distinctif de la stratégie d'Ant est le choix de rendre leurs modèles open source : Ling-Lite a 16,8 milliards de paramètres, tandis que Ling-Plus atteint 290 milliards.
Pour faire une comparaison, il est estimé que GPT-4.5, le modèle avancé développé par OpenAI, a environ 1,8 trillion de paramètres. Bien qu'il soit fermé et non accessible au public. La recherche menée par Ant n'est pas sans défis.
La même étude indique que, pendant l'entraînement, de petites variations dans la structure des modèles ou dans le type de matériel peuvent générer une instabilité de performance, comme des pics dans les taux d'erreur.
Une difficulté structurelle qui met en lumière comment, malgré les progrès, même les modèles les plus avancés nécessitent une attention constante.
Comme l'a observé Robin Yu, CTO de la société technologique Beijing Shengshang Tech, les résultats tangibles obtenus dans le monde réel sont ce qui compte vraiment :
« Si vous trouvez un point faible pour vaincre le meilleur maître de kung-fu au monde, vous avez quand même gagné. »
Une métaphore efficace qui souligne la valeur des applications pratiques par rapport à une simple comparaison théorique.
Ce qui ressort clairement, c'est qu'Ant Group joue un rôle clé dans la tentative de la Chine de devenir plus autonome sur le plan technologique.
Poursuivant par conséquent une IA plus accessible, moins dépendante du matériel occidental, et potentiellement plus efficace pour les secteurs industriels stratégiques de l'avenir.
Le défi lancé aux géants de l'IA occidentale n'est pas de les surpasser par la force brute, mais par l'intelligence, l'efficacité et la vision stratégique.
Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
Ant Group se concentre sur les puces chinoises pour renforcer sa stratégie en intelligence artificielle (AI)
Dans un contexte mondial de plus en plus marqué par la concurrence technologique entre les États-Unis et la Chine, Ant Group, contrôlé par Alibaba, prend des mesures significatives pour réduire sa dépendance aux puces américaines et contenir les coûts dans le développement des modèles d'intelligence artificielle (AI).
Selon des sources proches de l'entreprise, Ant compte sur des semiconduttori cinesi pour former ses modèles linguistiques avancés, en utilisant une approche qui promet de révolutionner la manière dont l'IA est produite dans le pays asiatique.
Point de tournant stratégique dans l'entraînement des modèles d'IA pour Ant Group
Au cours des derniers mois, Ant Group a adopté des puces fournies par des entreprises locales, y compris des entités liées à Alibaba et Huawei Technologies, pour entraîner ses modèles d’IA à l’aide de la technique Mixture of Experts (MoE)
Cette approche, de plus en plus répandue parmi les chercheurs, permet de diviser efficacement les tâches entre différents "experti" au sein du modèle, améliorant ainsi son efficacité computationnelle.
Les sources assurent que les résultats de ces modèles ne sont pas seulement comparables à ceux obtenus avec les puces Nvidia H800. Cependant, dans certains tests, ils auraient même dépassé la performance des modèles développés par Meta.
Bien que Bloomberg News n'ait pas vérifié de manière indépendante ces performances, les données indiquent des progrès significatifs dans la tentative de la Chine de réduire ses coûts opérationnels et de diminuer sa dépendance technologique.
La technique MoE est inspirée par le principe de délégation spécialisée : chaque sous-module du modèle est responsable d'une portion spécifique du traitement, permettant une plus grande évolutivité et une efficacité par rapport aux approches traditionnelles.
En plus d’Ant Group, Google et la start-up chinoise de Hangzhou DeepSeek utilisent également cette méthodologie.
Ant a souligné son engagement en faveur de la diffusion scientifique en publiant un article qui met l’accent sur l’objectif de mise à l’échelle des modèles sans l’utilisation de GPU haut de gamme
Cette approche devient cruciale pour les entreprises qui, en raison des coûts élevés, ne peuvent pas se permettre d'utiliser en continu du matériel haute performance.
Chine contre États-Unis : puces locales contre GPU américains
L'initiative d'Ant s'inscrit dans un contexte géopolitique où les entreprises technologiques chinoises tentent de contourner les restrictions américaines sur l'exportation de puces avancées, telles que la Nvidia H800.
Même s’il ne s’agit pas de la puce la plus avancée du marché, le H800 reste l’un des GPU les plus puissants disponibles en Chine.
Bien qu'Ant Group maintienne toujours une partie de sa production d'IA basée sur des puces Nvidia, l'entreprise s'oriente progressivement vers des alternatives plus économiques et facilement accessibles. Comme celles proposées par AMD et des fabricants chinois.
Ce choix stratégique marque une rupture avec la vision du PDG d'Nvidia, Jensen Huang, selon laquelle les entreprises continueront à exiger de plus en plus de puissance de calcul.
Selon Huang, les investissements des clients ne diminueront pas, même avec l'émergence de modèles plus efficaces comme DeepSeek R1. Cela montre donc un contraste clair avec la philosophie adoptée par Ant.
L'un des points forts de l'analyse d'Ant concerne la réduction significative du coût de formation des modèles d'IA.
Selon le document publié, former un modèle sur un trillion de tokens, les unités de base utilisées pour l'apprentissage, coûte traditionnellement environ 6,35 millions de yuans ( environ 880 000 dollars ).
En utilisant des puces moins performantes, optimisées cependant pour la méthode MoE, le coût a été réduit à 5,1 millions de yuans.
Une économie non marginale, qui pourrait révolutionner l'accessibilité à l'intelligence artificielle, en particulier pour les startups et les secteurs industriels émergents.
Les modèles développés, Ling-Lite et Ling-Plus, ont été conçus pour des applications dans des contextes tels que la santé et la finance, deux domaines où la puissance de l'IA peut offrir des solutions concrètes et immédiates.
Précisément dans le domaine de la santé, Ant a récemment acquis Haodf.com, l'une des principales plateformes médicales en ligne en Chine. Confirmant ainsi son intérêt pour l'expansion de l'offre de solutions basées sur l'intelligence artificielle.
Parmi les services existants de l'entreprise figurent également Zhixiaobao, un assistant virtuel, et la plateforme de conseil financier Maxiaocai.
“
html Ouverture et avenir de l'intelligence artificielle chinoise “
Un autre point distinctif de la stratégie d'Ant est le choix de rendre leurs modèles open source : Ling-Lite a 16,8 milliards de paramètres, tandis que Ling-Plus atteint 290 milliards.
Pour faire une comparaison, il est estimé que GPT-4.5, le modèle avancé développé par OpenAI, a environ 1,8 trillion de paramètres. Bien qu'il soit fermé et non accessible au public. La recherche menée par Ant n'est pas sans défis.
La même étude indique que, pendant l'entraînement, de petites variations dans la structure des modèles ou dans le type de matériel peuvent générer une instabilité de performance, comme des pics dans les taux d'erreur.
Une difficulté structurelle qui met en lumière comment, malgré les progrès, même les modèles les plus avancés nécessitent une attention constante.
Comme l'a observé Robin Yu, CTO de la société technologique Beijing Shengshang Tech, les résultats tangibles obtenus dans le monde réel sont ce qui compte vraiment :
« Si vous trouvez un point faible pour vaincre le meilleur maître de kung-fu au monde, vous avez quand même gagné. »
Une métaphore efficace qui souligne la valeur des applications pratiques par rapport à une simple comparaison théorique.
Ce qui ressort clairement, c'est qu'Ant Group joue un rôle clé dans la tentative de la Chine de devenir plus autonome sur le plan technologique.
Poursuivant par conséquent une IA plus accessible, moins dépendante du matériel occidental, et potentiellement plus efficace pour les secteurs industriels stratégiques de l'avenir.
Le défi lancé aux géants de l'IA occidentale n'est pas de les surpasser par la force brute, mais par l'intelligence, l'efficacité et la vision stratégique.