Zhipu est officiellement devenu public le 8 janvier, marquant un moment décisif pour le secteur des grands modèles linguistiques en Chine. Avec cette étape, le professeur Tang Jie—président en informatique à Tsinghua et scientifique en chef fondateur de l’entreprise—a publié une note stratégique interne qui redéfinit fondamentalement l’orientation de l’entreprise pour 2026. Plutôt que de poursuivre des gains commerciaux à court terme, Zhipu mise sur la recherche de modèles fondamentaux, signalant une réponse décisive aux effets d’entraînement créés par la percée de DeepSeek.
Le Vrai Champ de Bataille : Architecture des Modèles et Paradigmes d’Apprentissage
La note de Tang Jie clarifie une chose : le paysage concurrentiel futur ne sera pas déterminé par des applications flashy ou des lancements de produits incrémentiels. Il dépendra de deux piliers critiques—l’innovation en architecture de modèles et des paradigmes d’apprentissage fondamentalement nouveaux. Ce pivot stratégique reflète une compréhension mature de ce qui fait réellement avancer le développement de l’AGI.
L’engagement de l’entreprise envers des avancées architecturales est particulièrement révélateur. Le modèle Transformer, qui domine depuis près d’une décennie, commence à montrer des fissures sous la pression du monde réel. Les problèmes liés à la surcharge computationnelle pour des contextes ultra-longs, aux mécanismes de mémoire, et aux protocoles de mise à jour des modèles exigent une nouvelle réflexion architecturale. La feuille de route de Zhipu vise explicitement à dépasser les sondes von Neumann des systèmes existants, en explorant des paradigmes de conception entièrement nouveaux et des approches d’extension. Cela inclut des stratégies de co-conception puce-algorithme visant à améliorer fondamentalement l’efficacité computationnelle.
L’annonce principale concerne la sortie imminente de GLM-5. Bien que les détails restent rares, la progression précédente des modèles de Zhipu nous indique à quoi nous attendre. GLM-4.7, lancé en décembre, a déjà réalisé quelque chose de significatif : il s’est classé premier parmi les modèles nationaux et a partagé la sixième place mondiale avec Claude 4.5 Sonnet sur le benchmark Artificial Analysis. Plus révélateur encore, les retours des développeurs du monde réel sur la programmation et l’expérience des agents ont été constamment positifs.
Les chiffres qui soutiennent cette performance sont stupéfiants. En seulement 10 mois, la plateforme MaaS de Zhipu est passée de 20 millions à 500 millions de revenus annuels—une expansion de 25 fois. Des développeurs de 184 pays, totalisant plus de 150 000, ont adopté la suite de programmation de GLM. Les revenus à l’étranger ont dépassé 200 millions, ce qui suggère que l’entreprise a réussi à pénétrer le marché international de manière que beaucoup d’entreprises chinoises d’IA n’ont pas encore atteinte.
Le Point d’Inflection de l’Apprentissage par Renforcement
Les approches RL (apprentissage par renforcement) traditionnelles, malgré leur puissance mathématique et en codage, atteignent un plafond. Elles dépendent trop fortement d’environnements de vérification artificiels, limitant leur capacité à généraliser. La feuille de route de Zhipu pour 2026 vise explicitement des paradigmes RL plus généraux—capables de gérer des séquences de tâches de plusieurs heures ou jours nécessitant une compréhension authentique plutôt que de simples correspondances de motifs selon des critères humains.
Ce changement est crucial car c’est là que l’IA passe d’une boîte à outils sophistiquée à quelque chose de plus proche du raisonnement autonome.
La Frontière Dont Personne Ne Parle : Apprentissage Continu
Peut-être l’élément le plus audacieux du plan 2026 de Zhipu est l’exploration de l’apprentissage continu et de l’évolution autonome des modèles. Les systèmes d’IA actuels sont figés une fois déployés. Ils accumulent des connaissances via des processus d’entraînement coûteux et à coup unique, puis se dégradent progressivement à mesure que le monde change. Le cerveau humain, en revanche, apprend et s’adapte en permanence grâce à l’interaction avec le monde réel.
Construire cette capacité représente une véritable frontière. Cela nécessite de repenser tout, des protocoles d’apprentissage en ligne à l’intégration continue des connaissances sans oubli catastrophique. La réussite dans ce domaine représenterait un changement fondamental dans le fonctionnement des systèmes d’IA.
Comment Zhipu a Perdu Son Chemin (et Comment DeepSeek a Aidé à le Corriger)
Le moment le plus sincère de la note survient lorsque Tang Jie reconnaît ses erreurs passées. Entre 2023 et 2024, lors de l’explosion mondiale des grands modèles et de la “guerre des cent modèles” en Chine, Zhipu a commis des erreurs tactiques—tant techniques que commerciales. L’entreprise s’est laissée distraire par la dynamique à court terme, perdant de vue les fondamentaux de l’AGI.
L’émergence de DeepSeek a servi d’appel au réveil. Plutôt que de la voir comme une simple pression concurrentielle, Tang Jie la considère comme un signal de réinitialisation. L’entreprise s’est restructurée systématiquement, en coupant ses opérations To C, en rationalisant ses équipes de développement produit, et en resserrant son focus. Importamment, Zhipu a identifié la programmation comme vecteur de percée—une décision qui s’est avérée correcte lorsque GLM-4.5 et plus tard GLM-4.7 ont démontré une véritable parité compétitive avec les benchmarks internationaux.
L’IA Souveraine et la Stratégie d’Expansion Globale
Un développement secondaire mais notable : l’initiative “Sovereign AI” de Zhipu gagne du terrain à l’international. La Malaisie a construit sa plateforme nationale MaaS en utilisant le modèle open-source de GLM, faisant ainsi de la technologie de Zhipu une composante de l’infrastructure étatique. Cela s’aligne avec les efforts stratégiques pour que la technologie IA chinoise atteigne une adoption mondiale—mais cela montre aussi une adéquation produit-marché tangible au-delà des frontières nationales.
2026 : L’Année où l’IA Remplacera Vraiment les Catégories de Travail
Sous toute cette discussion technique se cache une affirmation plus audacieuse : 2026 sera l’année de rupture où l’IA remplacera réellement des catégories professionnelles spécifiques et des domaines de tâches. Ce n’est pas du hype—c’est basé sur l’expansion pratique des capacités des modèles et les taux d’adoption des développeurs déjà visibles dans les données de 2025.
La nouvelle initiative X-Lab de l’entreprise—un incubateur d’innovation interne destiné à rassembler de jeunes talents et à poursuivre des explorations de pointe, y compris de nouvelles architectures et paradigmes cognitifs—suggère que la direction croit qu’ils sont à un point d’inflexion où des paris audacieux deviennent nécessaires. Cela fait écho à des moments antérieurs où Zhipu a pris des décisions à haut risque : entraîner GLM-130B alors que de petits modèles dominaient, ou miser sur la programmation comme vecteur de percée.
Ce Que Cela Signifie pour l’Industrie
Le lancement public de Zhipu et sa réinitialisation stratégique sont importants car ils signalent une recalibration de la façon dont le secteur de l’IA en Chine envisage la compétition. Plutôt que de courir après des applications aussi larges que possible ou de poursuivre l’échelle pour elle-même, l’entreprise revient aux fondamentaux—et présente cette retraite comme la stratégie gagnante. La réussite de cette stratégie se révélera probablement à travers la réception de GLM-5 et les progrès pratiques en RL et apprentissage continu d’ici 2026.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
L'entrée en scène publique de Zhipu marque un tournant majeur : plongée approfondie dans GLM-5 et la course pour remodeler les fondations de l'IA
Zhipu est officiellement devenu public le 8 janvier, marquant un moment décisif pour le secteur des grands modèles linguistiques en Chine. Avec cette étape, le professeur Tang Jie—président en informatique à Tsinghua et scientifique en chef fondateur de l’entreprise—a publié une note stratégique interne qui redéfinit fondamentalement l’orientation de l’entreprise pour 2026. Plutôt que de poursuivre des gains commerciaux à court terme, Zhipu mise sur la recherche de modèles fondamentaux, signalant une réponse décisive aux effets d’entraînement créés par la percée de DeepSeek.
Le Vrai Champ de Bataille : Architecture des Modèles et Paradigmes d’Apprentissage
La note de Tang Jie clarifie une chose : le paysage concurrentiel futur ne sera pas déterminé par des applications flashy ou des lancements de produits incrémentiels. Il dépendra de deux piliers critiques—l’innovation en architecture de modèles et des paradigmes d’apprentissage fondamentalement nouveaux. Ce pivot stratégique reflète une compréhension mature de ce qui fait réellement avancer le développement de l’AGI.
L’engagement de l’entreprise envers des avancées architecturales est particulièrement révélateur. Le modèle Transformer, qui domine depuis près d’une décennie, commence à montrer des fissures sous la pression du monde réel. Les problèmes liés à la surcharge computationnelle pour des contextes ultra-longs, aux mécanismes de mémoire, et aux protocoles de mise à jour des modèles exigent une nouvelle réflexion architecturale. La feuille de route de Zhipu vise explicitement à dépasser les sondes von Neumann des systèmes existants, en explorant des paradigmes de conception entièrement nouveaux et des approches d’extension. Cela inclut des stratégies de co-conception puce-algorithme visant à améliorer fondamentalement l’efficacité computationnelle.
GLM-5 Arrive : Quels Changements Lorsqu’Il Arrivera
L’annonce principale concerne la sortie imminente de GLM-5. Bien que les détails restent rares, la progression précédente des modèles de Zhipu nous indique à quoi nous attendre. GLM-4.7, lancé en décembre, a déjà réalisé quelque chose de significatif : il s’est classé premier parmi les modèles nationaux et a partagé la sixième place mondiale avec Claude 4.5 Sonnet sur le benchmark Artificial Analysis. Plus révélateur encore, les retours des développeurs du monde réel sur la programmation et l’expérience des agents ont été constamment positifs.
Les chiffres qui soutiennent cette performance sont stupéfiants. En seulement 10 mois, la plateforme MaaS de Zhipu est passée de 20 millions à 500 millions de revenus annuels—une expansion de 25 fois. Des développeurs de 184 pays, totalisant plus de 150 000, ont adopté la suite de programmation de GLM. Les revenus à l’étranger ont dépassé 200 millions, ce qui suggère que l’entreprise a réussi à pénétrer le marché international de manière que beaucoup d’entreprises chinoises d’IA n’ont pas encore atteinte.
Le Point d’Inflection de l’Apprentissage par Renforcement
Les approches RL (apprentissage par renforcement) traditionnelles, malgré leur puissance mathématique et en codage, atteignent un plafond. Elles dépendent trop fortement d’environnements de vérification artificiels, limitant leur capacité à généraliser. La feuille de route de Zhipu pour 2026 vise explicitement des paradigmes RL plus généraux—capables de gérer des séquences de tâches de plusieurs heures ou jours nécessitant une compréhension authentique plutôt que de simples correspondances de motifs selon des critères humains.
Ce changement est crucial car c’est là que l’IA passe d’une boîte à outils sophistiquée à quelque chose de plus proche du raisonnement autonome.
La Frontière Dont Personne Ne Parle : Apprentissage Continu
Peut-être l’élément le plus audacieux du plan 2026 de Zhipu est l’exploration de l’apprentissage continu et de l’évolution autonome des modèles. Les systèmes d’IA actuels sont figés une fois déployés. Ils accumulent des connaissances via des processus d’entraînement coûteux et à coup unique, puis se dégradent progressivement à mesure que le monde change. Le cerveau humain, en revanche, apprend et s’adapte en permanence grâce à l’interaction avec le monde réel.
Construire cette capacité représente une véritable frontière. Cela nécessite de repenser tout, des protocoles d’apprentissage en ligne à l’intégration continue des connaissances sans oubli catastrophique. La réussite dans ce domaine représenterait un changement fondamental dans le fonctionnement des systèmes d’IA.
Comment Zhipu a Perdu Son Chemin (et Comment DeepSeek a Aidé à le Corriger)
Le moment le plus sincère de la note survient lorsque Tang Jie reconnaît ses erreurs passées. Entre 2023 et 2024, lors de l’explosion mondiale des grands modèles et de la “guerre des cent modèles” en Chine, Zhipu a commis des erreurs tactiques—tant techniques que commerciales. L’entreprise s’est laissée distraire par la dynamique à court terme, perdant de vue les fondamentaux de l’AGI.
L’émergence de DeepSeek a servi d’appel au réveil. Plutôt que de la voir comme une simple pression concurrentielle, Tang Jie la considère comme un signal de réinitialisation. L’entreprise s’est restructurée systématiquement, en coupant ses opérations To C, en rationalisant ses équipes de développement produit, et en resserrant son focus. Importamment, Zhipu a identifié la programmation comme vecteur de percée—une décision qui s’est avérée correcte lorsque GLM-4.5 et plus tard GLM-4.7 ont démontré une véritable parité compétitive avec les benchmarks internationaux.
L’IA Souveraine et la Stratégie d’Expansion Globale
Un développement secondaire mais notable : l’initiative “Sovereign AI” de Zhipu gagne du terrain à l’international. La Malaisie a construit sa plateforme nationale MaaS en utilisant le modèle open-source de GLM, faisant ainsi de la technologie de Zhipu une composante de l’infrastructure étatique. Cela s’aligne avec les efforts stratégiques pour que la technologie IA chinoise atteigne une adoption mondiale—mais cela montre aussi une adéquation produit-marché tangible au-delà des frontières nationales.
2026 : L’Année où l’IA Remplacera Vraiment les Catégories de Travail
Sous toute cette discussion technique se cache une affirmation plus audacieuse : 2026 sera l’année de rupture où l’IA remplacera réellement des catégories professionnelles spécifiques et des domaines de tâches. Ce n’est pas du hype—c’est basé sur l’expansion pratique des capacités des modèles et les taux d’adoption des développeurs déjà visibles dans les données de 2025.
La nouvelle initiative X-Lab de l’entreprise—un incubateur d’innovation interne destiné à rassembler de jeunes talents et à poursuivre des explorations de pointe, y compris de nouvelles architectures et paradigmes cognitifs—suggère que la direction croit qu’ils sont à un point d’inflexion où des paris audacieux deviennent nécessaires. Cela fait écho à des moments antérieurs où Zhipu a pris des décisions à haut risque : entraîner GLM-130B alors que de petits modèles dominaient, ou miser sur la programmation comme vecteur de percée.
Ce Que Cela Signifie pour l’Industrie
Le lancement public de Zhipu et sa réinitialisation stratégique sont importants car ils signalent une recalibration de la façon dont le secteur de l’IA en Chine envisage la compétition. Plutôt que de courir après des applications aussi larges que possible ou de poursuivre l’échelle pour elle-même, l’entreprise revient aux fondamentaux—et présente cette retraite comme la stratégie gagnante. La réussite de cette stratégie se révélera probablement à travers la réception de GLM-5 et les progrès pratiques en RL et apprentissage continu d’ici 2026.