Après l’interdiction de NVIDIA, où va l’IA en Chine ?

Source d’origine : Corps polaire cérébral

Source de l’image : Généré par Unbounded AI

Le 17 octobre, les États-Unis ont renforcé l’interdiction des puces d’IA pour le marché chinois. Parmi celles-ci, la performance et la densité sont clairement considérées comme des normes de contrôle des exportations, et les puces d’une puissance de calcul de plus de 300 téraflops par puce et d’une densité de performance de plus de 370 gigaflops par millimètre carré sont incluses dans la liste des exportations interdites.

Bien qu’en vertu de cette interdiction, les puces d’IA haut de gamme fournies par AMD, Intel et d’autres sociétés sont également concernées. Cependant, en raison de la domination de Nvidia dans le domaine mondial des puces d’IA, cette interdiction implique l’entraînement de l’IA grand public sur les GPU NVIDIA tels que A100 et H100, de sorte que cette interdiction de puce est également connue sous le nom de « interdiction NVIDIA ».

Dès que la nouvelle est sortie, elle a immédiatement suscité des discussions animées dans l’industrie de l’IA. Cependant, la plupart des discussions ont porté sur le moment où l’interdiction sera mise en œuvre, s’il existe une zone tampon, quels modèles de GPU sont concernés et combien de temps durera l’interdiction. Cela conduit à un contexte macroéconomique évident qui a été négligé : bien que les relations économiques et commerciales entre la Chine et les États-Unis aient fluctué de temps en temps depuis l’éclatement des frictions commerciales, le contrôle des puces pour la Chine a toujours augmenté sans relâche. En particulier, l’interdiction des puces d’IA haut de gamme a été fermement mise en œuvre dans de nombreuses controverses.

À ce stade, il semble que l’industrie de l’IA doive former un consensus de base : abandonner les illusions et se préparer au combat.

Au lieu de s’inquiéter de savoir quels GPU sont interdits, s’il est possible de lever l’interdiction. Pourquoi ne réexaminez-vous pas l’évolution de l’informatique basée sur l’IA en Chine à l’ère du rideau de fer des puces ?

Dans cet article, nous espérons partir de la situation actuelle de l’industrie et réfléchir à la voie à suivre pour l’informatique basée sur l’IA.

Situation actuelle

Tout d’abord, nous devons comprendre une question, c’est-à-dire pourquoi, après l’introduction de l’interdiction de NVIDIA, la réaction de l’opinion publique et de l’industrie de l’IA n’a pas été aussi sérieuse qu’elle l’était au début du blocus des puces en 18 ou 19. Il semble que seule la question de savoir si la carte graphique grand public RTX 4090 est interdite a suscité un débat parmi les joueurs et les commerçants associés.

La logique macroéconomique derrière cela est que l’industrie est très réticente à voir les puces d’IA haut de gamme interdites, mais en fait, cette situation était attendue depuis longtemps. D’une part, les États-Unis ont promu le blocus des puces en Chine pendant de nombreuses années, et certains des GPU haut de gamme de Nvidia ont été interdits, et les commentaires de l’industrie ont depuis longtemps été ajustés du choc au calme. De plus, après l’explosion de ChatGPT, le marché mondial des GPU haut de gamme a fortement augmenté cette année, suivi par les déclarations répétées des États-Unis pour promouvoir l’interdiction globale de la vente de puces d’IA haut de gamme à la Chine. Après quelques mois, il n’est pas différent de tomber enfin un marteau.

Afin de faire face à cette interdiction prévisible, et en même temps il y a une promotion objective du développement de grands modèles, de la fin de l’année dernière au premier semestre de cette année, un grand nombre d’entreprises chinoises dans les domaines de la science et de la technologie, de la finance et de l’automobile se sont concentrées sur le stockage des GPU haut de gamme de Nvidia, ce qui a provoqué une situation où il est difficile de trouver une carte sur le marché. En d’autres termes, pour de nombreuses petites et moyennes entreprises technologiques chinoises et des startups d’IA, les GPU haut de gamme ne peuvent pas être achetés, et peu de choses ont changé depuis l’interdiction.

Une autre réalité est que les puces d’IA haut de gamme ne sont pas impossibles à localiser. Dès 18 et 19 ans après le début des frictions commerciales, l’industrie nationale des puces d’IA a accéléré son développement. Cela conduit au fait qu’en termes de besoins d’entraînement de l’IA, bien que les GPU haut de gamme de NVIDIA soient difficiles à remplacer, ils ne sont pas irremplaçables.

De plus, les puces d’IA ne sont pas aussi pertinentes pour les consommateurs de masse que les puces de téléphone mobile, et Huawei a fait une percée dans les puces de téléphonie mobile. Toutes sortes de signes se sont combinés pour amener le public et l’industrie à avoir une mentalité calme, voire un peu étrange, à propos de cette interdiction.

Mais il faut voir objectivement que cette interdiction n’est en aucun cas inoffensive pour l’industrie chinoise de l’IA. D’une part, il est très difficile de remplacer les GPU NVIDIA à court terme, tant en termes de capacité de production de puces que de compatibilité écologique. Et l’interdiction causera également un préjudice direct aux fabricants qui utilisent les produits NVIDIA à grande échelle dans des domaines tels que les serveurs d’IA.

Le problème le plus critique est qu’à l’avenir, si l’interdiction persiste pendant une longue période, l’informatique d’IA de la Chine se découplera progressivement des puces haut de gamme du monde, et les effets négatifs possibles à long terme sont très complexes, tels que :

  1. Les puces d’IA représentées par les GPU haut de gamme de NVIDIA provoqueront-elles une déconnexion dans le développement de la puissance de calcul de l’IA en Chine après avoir été mises à jour et itérées ?

  2. Après le développement de la divergence sous-jacente de la puissance de calcul, l’industrie chinoise de l’IA prendra-t-elle du retard dans le développement de technologies logicielles telles que les grands modèles ?

  3. Cette interdiction des puces d’IA a montré les caractéristiques des blocages à grande échelle. Ce blocus technologique ne restera-t-il vraiment que dans le domaine des puces d’IA ? Les capacités numériques de base telles que la puissance de calcul générale, le stockage et les logiciels de base deviendra-t-elles les prochaines cibles ?

Dans l’ensemble, l’interdiction des puces d’IA est un jeu préparé pour la Chine, pas une attaque surprise. Si vous voulez réussir à passer ce niveau, vous devez également bien jouer toutes les cartes de votre main et les jouer ensemble, afin de réduire l’intensité des dégâts et d’augmenter le taux de victoire à long terme.

À l’heure actuelle, l’informatique basée sur l’IA en Chine a trois « plans de percée » sur lesquels il faut travailler en même temps.

Option 1 : Faire bon usage de l’identité « acheteur »

Il y a une vérité simple, la logique du comportement du marché commercial est déterminée par l’offre et la demande. Cependant, dans le commerce technologique entre la Chine et les États-Unis, représenté par les puces, nous tombons souvent dans une erreur de réflexion : nous pensons que la plupart des règles du jeu sont fixées par le gouvernement et les entreprises américaines, et qu’ils veulent nous vendre, nous achèterons, et qu’ils ne voudront pas nous acheter.

En tant que plus grand « acheteur » du marché mondial des puces, les entreprises chinoises n’ont pas le droit de s’exprimer, ce qui est très absurde.

En fait, l’interdiction des puces d’IA sur le marché chinois a directement nui aux géants américains de la technologie représentés par Nvidia. À l’heure actuelle, la plus grande demande du marché pour les puces d’IA de NVIDIA provient de Chine. Auparavant, le PDG de Nvidia, Jensen Huang, avait clairement indiqué que « si nous sommes privés du marché chinois, nous n’avons pas de mesures d’urgence, et il n’y a pas d’autre Chine dans le monde ».

Dans ce contexte, nous pouvons voir une contradiction aiguë entre les entreprises technologiques américaines, qui poursuivent des intérêts commerciaux, et le gouvernement américain, qui poursuit des intérêts politiques. Les entreprises technologiques américaines sont toujours à la recherche de moyens de s’opposer et de contourner l’interdiction, comme Nvidia, qui a lancé une version spécifique à la Chine du GPU en réponse à l’embargo l’année dernière.

Le marché chinois digère environ un tiers de la capacité de production des entreprises technologiques américaines, et le lien entre l’offre et la demande entre les deux ne peut pas être rompu avant longtemps. Face à l’interdiction globale de plus en plus évidente de la technologie aux États-Unis, le marché chinois devrait également faire un bon usage de son statut d'« acheteur » pour rendre son propre comportement plus distinct et prévisible.

Évitez de créer une sorte de performance et d’impression « bienvenue si vous vendez, seulement impuissant si vous ne vendez pas ».

« L’identité de l’acheteur » doit être celle qui a une position, un pouvoir et une colère.

Schéma 2 : Remplacez la carte par le cloud, et la puissance de calcul est concentrée

Pendant une longue période, l’interdiction américaine des puces d’IA chinoises ne peut que se renforcer, et ce moment coïncide avec l’étape critique du développement des grands modèles d’IA. Beaucoup de gens dans l’industrie pensent que bien que le développement de grands modèles soit rapide, il n’a pas montré la situation rapide d’autres débouchés scientifiques et technologiques auparavant, et le manque d’argent pour l’investissement et le manque de cartes pour l’informatique en sont les principales raisons.

Alors, comment résoudre le problème de l’écart de puissance de calcul dans l’industrie chinoise de l’IA dans le cadre de l’interdiction ? Le premier plan d’urgence consiste pour les entreprises à augmenter l’allocation et l’investissement de la puissance de calcul de l’IA dans le cloud et à promouvoir l’utilisation du cloud pour remplacer les cartes.

En fait, dans le cadre de la tendance générale selon laquelle les puces d’IA haut de gamme pourraient être interdites, plusieurs grands fabricants de cloud public en Chine ont pris des mesures pour augmenter leur accumulation de GPU haut de gamme de Nvidia. D’une part, cela s’explique par le fait que les fournisseurs de cloud eux-mêmes doivent augmenter leurs investissements dans les grands modèles et ouvrir le marché du MaaS, de sorte qu’il existe une demande directe de puissance de calcul de l’IA. D’autre part, c’est aussi parce que les GPU peuvent être réutilisés pendant une longue période après avoir été convertis en pools de ressources cloud, ce qui est une situation où les fournisseurs de cloud peuvent attaquer et battre en retraite. Par conséquent, au cours du premier semestre de cette année, il y a eu une situation où toutes les puces d’IA haut de gamme sur le marché ont afflué vers les fabricants de cloud, et il était difficile pour les petites et moyennes entreprises de trouver une carte.

D’un point de vue objectif, ce passage des puces d’IA haut de gamme vers le cloud est bénéfique pour l’ensemble du marché chinois pour faire face à l’interdiction des puces d’IA, et s’inscrit également dans la réflexion stratégique d’Eastern Data et de Western Computing.

Une autre tendance favorable à la puissance de calcul de l’IA dans le cloud est l’augmentation du nombre de paramètres de modèle volumineux et de la quantité de données utilisées. L’entraînement localisé sur les pools de cartes est devenu de plus en plus serré. La kilocalorie et l’entraînement de 10 000 calories qui doivent avoir lieu dans le cloud sont devenus la principale direction de développement à l’avenir, de sorte que les utilisateurs d’entreprise seront naturellement plus actifs dans le cloud.

Dans le même temps, la puissance de calcul de l’IA dans le cloud ne restera pas seulement au niveau de la thésaurisation des GPU NVIDIA. Ensuite, c’est la tendance générale à la puissance de calcul de l’IA indépendante nationale à se diriger vers le cloud. Poussés par des politiques pertinentes, les fournisseurs de cloud augmentent l’achat de puces d’IA indépendantes. Selon les données d’IDC, au cours du premier semestre 2023, 500 000 puces d’accélération d’IA auto-développées ont été utilisées dans les serveurs d’IA chinois. En ce qui concerne la servitisation de la puissance de calcul de l’IA autonome, HUAWEI CLOUD a lancé le service cloud Ascend AI. La puissance de calcul de l’IA, qui allie cloud et autonomie, sera fortement développée dans le cadre de l’interdiction des puces d’IA.

En outre, ces dernières années, un grand nombre de centres de calcul de l’IA utilisant une puissance de calcul indépendante de l’IA ont été établis dans divers endroits dans le contexte des données orientales et de l’informatique occidentale, et dans l’ensemble, la puissance de calcul de l’IA en nuage de la Chine est stable et fiable.

Cependant, de nombreuses entreprises préfèrent encore acheter de la puissance de calcul locale en matière d’IA. D’une part, cela s’explique par le fait que le marché des GPU NVIDIA est rare, et que la conservation de la valeur est particulièrement bonne, et qu’il peut même être utilisé comme actif principal de l’entreprise. D’autre part, la puissance de calcul de l’IA dans le cloud présente souvent des problèmes tels que les files d’attente, les temps d’arrêt et le manque de services logiciels.

La manière d’améliorer encore l’expérience des développeurs à l’aide de la puissance de calcul de l’IA dans le cloud est la prochaine direction sur laquelle les fournisseurs de cloud public doivent se concentrer.

Solution 3 : Laisser la puissance de calcul de l’IA nationale croître de manière explosive

Face à une nouvelle série d’interdictions de puces d’IA, quelle est la plus grande confiance de l’industrie chinoise de l’IA ? Est-ce une habitude après de nombreuses années, ou y a-t-il un surplus de nourriture à la maison après un grand nombre de thunkas ? Ni. Le nœud le plus critique est qu’après des années de développement, l’industrie chinoise des puces d’IA s’est considérablement développée. Les GPU haut de gamme de Nvidia sont toujours importants, mais ce n’est pas comme s’il n’y avait pas d’alternative.

Selon les données précédemment publiées par IDC, les expéditions de cartes d’accélération d’IA en Chine en 2022 seront d’environ 1,09 million, dont la part de marché de Nvidia atteindra 85 %, la part de marché Ascend Reality de Huawei atteindra 10 %, celle de Baidu Kunlun sera de 2 % et celle de Cambrian et Suiyuan Technology sera de 1 %.

On peut voir que la puissance de calcul nationale de l’IA a atteint un certain degré de part de marché, et pas seulement « sur le papier » dans les concepts et les théories. Dans le même temps, il convient également de noter que les puces d’IA nationales ne sont toujours pas idéales en termes de performances de base, d’écologie logicielle et de capacité d’expédition, et qu’il reste encore un long chemin à parcourir. Dans les conditions objectives de l’interdiction de NVIDIA, la puissance de calcul nationale de l’IA doit surmonter ces difficultés à court terme et accélérer son propre cycle de croissance et de maturité.

Afin d’atteindre cet objectif, plusieurs choses sont très importantes :

**1. Former un consensus de l’industrie pour éviter toute confusion de concepts. **

En ce qui concerne les puces d’IA, nous disons souvent qu’il existe de nombreuses façons de les mettre en œuvre, et il existe de nombreuses marques indépendantes qui participent à ce marché, qui semble prospérer. Par exemple, les puces d’IA comprennent les GPU, les FPGA, les ASIC, l’intégration de stockage et de calcul et les puces de type cerveau, etc., et les fabricants nationaux de puces d’accélération de l’IA comprennent Alibaba, Baidu, Huawei, Cambrian, Haiguang Information, Suiyuan Technology, Tiantian Zhixin, Biqian Technology, Moore Threads, Loongson Zhongke, etc.

Ce type de « prospérité » est non seulement source de confusion dans l’opinion publique et sur le marché de l’investissement, mais apparaît aussi souvent dans certains rapports de l’industrie et analyses politiques. Mais le problème est que la définition des puces d’IA est généralement trop étendue. Par exemple, les puces ressemblant à des cerveaux ne sont que des imaginations techniques dans un avenir prévisible, et si des puces semblables à des cerveaux sont ajoutées chaque fois que des puces d’IA nationales sont discutées, cela ne fera que perdre du temps et distraire de l’énergie. Autre exemple, certains fabricants de puces d’IA ne peuvent fabriquer des puces que pour leur propre usage et ne peuvent pas les expédier sur le marché. Certains fournisseurs n’ont pas encore la capacité de commercialiser et en sont au début de la phase de construction, et leur contribution à l’autonomie informatique de l’IA à court terme est très faible.

Afin de faire face à l’interdiction des GPU haut de gamme de Nvidia, nous devons nous concentrer sur des alternatives GPU viables et efficaces, plutôt que de faire trop d’associations et de divergences. Ce n’est qu’en formant ce consensus industriel que nous pourrons rassembler des forces pour résoudre le problème. **

**2. S’orienter vers une utilisation commerciale à grande échelle et éviter la fabrication de noyaux PPT. **

En fait, peu importe du point de vue des puces d’accélération de l’IA ou des machines serveurs, il y a très peu de fabricants de puces d’IA qui peuvent expédier en Chine. Principalement concentrés dans Huawei et Baidu, Suiyuan Technology et Haiguang Information ont également certaines expéditions. Un grand nombre de fabricants de semi-conducteurs et d’entreprises d’IA sont encore coincés dans le plan et la vision de la construction de puces. Cela a conduit à la stagnation d’un grand nombre de puces d’IA nationales qui ont été soutenues par les politiques et les attentes du marché de l’investissement, et l’on soupçonne même de rester à ce stade pour profiter des dividendes du marché financier.

**La prochaine orientation de l’industrie devrait passer de la mise en place de puces d’IA à l’expédition de puces d’IA, aider les fabricants de puces d’IA à obtenir un retour d’information commercial direct, accepter les tests de marché des produits et de la capacité de production, et façonner progressivement un flux de trésorerie positif. **

  1. Renforcer l’écosystème logiciel et renforcer les capacités de migration. **

La raison pour laquelle le GPU NVIDIA est important n’est pas seulement dans les performances matérielles, mais aussi dans les capacités écologiques logicielles avec CUDA et PyTorch comme noyau, de sorte que le développement de puces d’IA nationales ne doit pas sous-estimer la capacité du logiciel. Tout en renforçant la construction de l’écosystème logiciel indépendant, il est également nécessaire de prêter attention à la capacité de migration et au coût de migration de la construction de modèles d’IA basés sur l’écosystème NVIDIA.

À cette fin, un grand nombre de fabricants ont exploré, comme le DCU de Haiguang Information, qui est très similaire à CUDA en termes d’écologie et d’environnement de programmation, et les utilisateurs de CUDA peuvent rapidement migrer vers la plate-forme ROCm de Haiguang à faible coût. Auparavant, PyTorch 2.1 annonçait la prise en charge de l’Ascend de Huawei. On peut voir que les puces d’IA nationales ont une certaine influence d’échelle et peuvent être mieux intégrées dans l’écosystème logiciel mondial.

** À l’avenir, si vous voulez réaliser l’explosion de l’informatique domestique de l’IA, vous ne pouvez pas laisser l’épidémie de l’écologie logicielle de base de l’IA domestique. **

  1. Augmenter le soutien à la « marque principale » et former un effet à grande échelle. **

Pour les puces d’IA américaines, en plus des GPU NVIDIA, que savez-vous d’autre ? Même si cette question est posée à certains développeurs d’IA, la réponse n’est pas claire ou n’a pas encore été essayée. On peut voir que l’informatique basée sur l’IA, tout comme l’informatique générale et l’informatique graphique, a une forte probabilité qu’une ou deux « marques principales » finissent par apparaître. Cela fait partie de la loi objective du marché, et il n’est pas nécessaire d’arriver à une situation de « laisser une centaine de fleurs s’épanouir » en arrachant les plants pour les aider à pousser.

Même dans la mesure où l’informatique d’IA de la Chine doit accélérer sa maturité et atteindre l’objectif de substitution autonome, c’est une bonne chose d’atteindre une situation d’un super et de plusieurs forts dès que possible. Cela permet d’éviter la fragmentation écologique et le gaspillage d’une grande quantité d’investissements informatiques causés par le basculement de l’industrie. Ce processus devrait être laissé au choix du marché, qui prend lentement forme. Cependant, dans le contexte de l’interdiction des puces, l’essor de l’informatique nationale de l’IA a pris fin, plutôt que de laisser 100 types de puces d’IA mûrir lentement et se mélanger lentement, comme accélérer la formation d’une situation de remplacement rapide des « marques principales ».

À en juger par la situation actuelle, Ascend est la force la plus susceptible de devenir la principale marque de puissance de calcul nationale de l’IA. Liu Qingfeng, fondateur et président d’iFLYTEK, a précédemment déclaré que le GPU de Huawei avait été comparé au NVIDIA A100. Selon les données, la puissance de calcul de précision en nombres entiers de l’Ascend 310 atteint 16 TOPS, et la puissance de calcul de précision en nombres entiers de l’Ascend 910 atteint 640 TOPS. Cela signifie que les performances de l’Ascend 910 sont proches de celles de la NVIDIA A100.

Dans le même temps, Ascend est actuellement la seule puissance de calcul nationale de l’IA qui a une part de marché stable, et a incubé une architecture de calcul hétérogène CANN similaire à NVIDIA CUDA et un cadre de calcul d’IA MindSpore dans le logiciel. En termes de performances de base, d’écosystème logiciel et de part de marché, Ascend a la possibilité d’accélérer la croissance et de réaliser une localisation à grande échelle de la puissance de calcul de l’IA.

**La normalisation des normes de l’industrie, le renforcement de la construction de logiciels et l’amélioration du soutien des marques indépendantes sont les principaux moyens de promouvoir la croissance rapide de la puissance de calcul de l’IA nationale à court terme. **

L’interdiction de Nvidia est un problème que l’industrie chinoise de l’IA ne veut généralement pas voir, essayer d’éviter, et même aujourd’hui, elle est un peu secrète. Cependant, la situation est plus forte que les personnes, et dans le processus accéléré de démondialisation et de course à l’IA, il y a une forte probabilité que des interdictions similaires ne soient que beaucoup plus probables à l’avenir.

L’évasion, le détour et le silence ne peuvent pas résoudre le problème, et ce n’est qu’en y faisant face calmement et en nous efforçant de nous améliorer nous-mêmes que nous pouvons résoudre fondamentalement le problème d’être contrôlé par les autres.

En vertu de l’interdiction, où va l’informatique d’IA de la Chine à partir d’ici ?

La réponse est que nous n’avons pas le choix, nous devons donc donner au monde un deuxième choix.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)