El 17 de octubre, Estados Unidos reforzó la prohibición de los chips de IA para el mercado chino. Entre ellos, el rendimiento y la densidad se consideran claramente normas de control de las exportaciones, y los chips con una potencia de cálculo de más de 300 teraflops por chip y una densidad de rendimiento de más de 370 gigaflops por milímetro cuadrado están incluidos en la lista de exportaciones prohibidas.
Aunque bajo esta prohibición, los chips de IA de gama alta proporcionados por AMD, Intel y otras empresas también se ven afectados. Sin embargo, debido al dominio de Nvidia en el campo global de los chips de IA, esta prohibición implica el entrenamiento de la IA convencional de las GPU NVIDIA como A100 y H100, por lo que esta prohibición de chips también se conoce como la "prohibición de NVIDIA".
Tan pronto como salió la noticia, inmediatamente despertó acaloradas discusiones en la industria de la IA. Sin embargo, la mayor parte de la discusión se centró en cuándo se implementará la prohibición, si hay una zona de amortiguamiento, qué modelos de GPU están involucrados y cuánto durará la prohibición. Esto lleva a un trasfondo macro obvio que se ha pasado por alto: aunque la relación económica y comercial entre China y Estados Unidos ha fluctuado de vez en cuando desde el estallido de la fricción comercial, el control de chips para China siempre ha aumentado sin cesar. En particular, la prohibición de los chips de IA de gama alta se ha aplicado firmemente en muchas controversias.
Llegados a este punto, parece que la industria de la IA tiene que formar un consenso básico: abandonar las ilusiones y prepararse para la lucha.
En lugar de preocuparse por qué GPU están prohibidas, si es posible levantar la prohibición. ¿Por qué no reexamina hacia dónde se dirige la computación de IA de China en la era de la Cortina de Hierro de los chips?
En este artículo, esperamos partir de la situación actual de la industria y pensar en el camino a seguir para la computación con IA.
Situación actual
En primer lugar, debemos entender una pregunta, es decir, por qué después de la introducción de la prohibición de NVIDIA, la reacción de la opinión pública y de la industria de la IA no fue tan grave como lo fue al comienzo del bloqueo de chips en 18 o 19. Parece que solo la cuestión de si la tarjeta gráfica de consumo RTX 4090 está prohibida ha provocado cierto debate entre los jugadores y los comerciantes relacionados.
La lógica macro detrás de esto es que la industria es muy reacia a que se prohíban los chips de IA de gama alta, pero de hecho, esta situación se esperaba desde hace mucho tiempo. Por un lado, Estados Unidos ha promovido el bloqueo de chips en China durante muchos años, y algunas de las GPU de gama alta de Nvidia han sido prohibidas, y los comentarios de la industria se han ajustado durante mucho tiempo de la conmoción a la calma. Además, tras la explosión de ChatGPT, el mercado mundial de GPU de gama alta ha aumentado considerablemente este año, seguido de las repetidas declaraciones de Estados Unidos para promover la prohibición general de la venta de chips de IA de gama alta a China. Después de unos meses, no es diferente finalmente caer un martillo.
Para hacer frente a esta previsible prohibición, y al mismo tiempo hay una promoción objetiva del desarrollo de modelos grandes, desde finales del año pasado hasta la primera mitad de este año, un gran número de empresas chinas en los campos de la ciencia y la tecnología, las finanzas y los automóviles se concentraron en almacenar las GPU de gama alta de Nvidia, lo que ha provocado una situación en la que es difícil encontrar una tarjeta en el mercado. En otras palabras, para muchas pequeñas y medianas empresas tecnológicas chinas y nuevas empresas de IA, las GPU de gama alta no se pueden comprar, y no ha cambiado mucho desde la prohibición.
Otra realidad es que los chips de IA de gama alta no son imposibles de localizar. Ya 18 y 19 años después del inicio de las fricciones comerciales, la industria nacional de chips de IA aceleró su desarrollo. Esto lleva al hecho de que en términos de necesidades de entrenamiento de IA, aunque las GPU de gama alta de NVIDIA son difíciles de reemplazar, no son insustituibles.
Además, los chips de IA no son tan relevantes para los consumidores masivos como los chips de teléfonos móviles, y Huawei ha hecho un gran avance en los chips de teléfonos móviles. Todo tipo de señales se han combinado para hacer que tanto el público como la industria tengan una mentalidad tranquila, incluso un poco extraña, sobre esta prohibición.
Pero hay que tener en cuenta objetivamente que esta prohibición no es en absoluto inofensiva para la industria china de la IA. Por un lado, es muy difícil sustituir a las GPU de NVIDIA a corto plazo, tanto en términos de capacidad de producción de chips como de compatibilidad ecológica. Y la prohibición también causará un daño directo a los fabricantes que utilizan productos NVIDIA a gran escala en áreas como los servidores de IA.
La cuestión más crítica es que en el futuro, si la prohibición persiste durante mucho tiempo, la computación de IA de China se desacoplará gradualmente de los chips de gama alta del mundo, y los posibles efectos negativos a largo plazo son muy complejos, como:
¿Los chips de IA representados por las GPU de gama alta de NVIDIA causarán una desconexión en el desarrollo de la potencia de cálculo de IA de China después de ser actualizados e iterados?
Después del desarrollo de la divergencia de potencia de cálculo subyacente, ¿se quedará atrás la industria de IA de China en el desarrollo de tecnologías de software como los grandes modelos?
Esta prohibición de los chips de IA ha mostrado las características de los bloqueos a gran escala. ¿Realmente este bloqueo tecnológico se quedará solo en el campo de los chips de IA? ¿Se convertirán las capacidades básicas digitales, como la potencia informática general, el almacenamiento y el software básico, en los próximos objetivos?
Con todo, la prohibición de los chips de IA es un juego preparado para China, no un ataque sorpresa. Si quieres superar con éxito este nivel, también debes jugar bien todas las cartas de tu mano y jugarlas juntas, para reducir la intensidad del daño y aumentar la tasa de ganancias a largo plazo.
En la actualidad, la computación de IA de China tiene tres "planes innovadores" en los que se debe trabajar al mismo tiempo.
Opción 1: Hacer un buen uso de la identidad del "comprador"
Hay una verdad simple, la lógica del comportamiento del mercado comercial está determinada por la oferta y la demanda. Sin embargo, en el comercio de tecnología entre China y Estados Unidos, representado por los chips, a menudo caemos en un error de pensamiento: pensamos que la mayoría de las reglas del juego las establecen el gobierno y las empresas estadounidenses, y quieren vendernos, compraremos y no querrán comprarnos.
Como el mayor "comprador" del mercado mundial de chips, las empresas chinas no tienen derecho a hablar, lo cual es muy absurdo.
De hecho, la prohibición de los chips de IA en el mercado chino ha perjudicado directamente a los gigantes tecnológicos estadounidenses representados por Nvidia. En la actualidad, la mayor demanda del mercado de chips de IA de NVIDIA proviene de China. Anteriormente, el CEO de Nvidia, Jensen Huang, dejó claro que "si nos privan del mercado chino, no tenemos medidas de emergencia, y no hay otra China en el mundo".
En este contexto, podemos ver una aguda contradicción entre las empresas tecnológicas estadounidenses, que persiguen intereses comerciales, y el gobierno de Estados Unidos, que persigue intereses políticos. Las empresas tecnológicas estadounidenses siempre están buscando formas de oponerse y eludir la prohibición, como Nvidia, que lanzó una versión específica de China de la GPU en respuesta al embargo el año pasado.
El mercado chino digiere alrededor de un tercio de la capacidad de producción de las empresas tecnológicas estadounidenses, y el vínculo entre la oferta y la demanda entre ambos no puede romperse durante mucho tiempo. Frente a la prohibición general de la tecnología cada vez más obvia en los Estados Unidos, el mercado chino también debería hacer un buen uso activo de su condición de "comprador" para hacer que su propio comportamiento sea más distinto y predecible.
Evite crear una especie de rendimiento e impresión de "bienvenido si vende, solo indefenso si no vende".
La "identidad del comprador" debe ser aquella que tenga una posición, poder y enojo.
Esquema 2: Reemplace la tarjeta con la nube y el poder de cómputo se concentrará
Durante un largo período de tiempo, la prohibición de EE. UU. sobre los chips de IA de China solo puede fortalecerse, y este momento coincide con la etapa crítica del desarrollo de grandes modelos de IA. Muchas personas en la industria creen que, aunque el desarrollo de grandes modelos es rápido, no ha mostrado antes la rápida situación de otros puntos de venta científicos y tecnológicos, y la falta de dinero para la inversión y la falta de tarjetas para la computación son las principales razones.
Entonces, ¿cómo resolver el problema de la brecha de poder de cómputo en la industria de IA de China bajo la prohibición? El primer plan de contingencia es que las empresas aumenten la asignación y la inversión de la potencia de computación de IA en la nube y promuevan el uso de la nube para reemplazar las tarjetas.
De hecho, bajo la tendencia general de que los chips de IA de gama alta pueden ser prohibidos, varios de los principales fabricantes de nube pública en China han tomado medidas para aumentar su acaparamiento de las GPU de gama alta de Nvidia. Por un lado, esto se debe a que los propios proveedores de la nube necesitan aumentar la inversión en modelos grandes y abrir el mercado de MaaS, por lo que existe una demanda directa de potencia informática de IA. Por otro lado, también se debe a que las GPU se pueden reutilizar durante mucho tiempo después de ser convertidas en grupos de recursos en la nube, que es una situación en la que los proveedores de la nube pueden atacar y retirarse. Por lo tanto, en la primera mitad de este año, hubo una situación en la que todos los chips de IA de gama alta del mercado fluyeron hacia los fabricantes de la nube, y fue difícil para las pequeñas y medianas empresas encontrar una tarjeta.
Desde un punto de vista objetivo, este traslado de chips de IA de alta gama a la nube es beneficioso para todo el mercado chino para hacer frente a la prohibición de los chips de IA, y también está en línea con el pensamiento estratégico de Eastern Data y Western Computing.
Otra tendencia que es buena para la potencia de computación de IA en la nube es el creciente número de parámetros de modelos grandes y la cantidad de datos utilizados. El entrenamiento localizado del grupo de cartas se ha vuelto cada vez más estricto. El entrenamiento de kilocalorías y 10.000 calorías que debe realizarse en la nube se ha convertido en la principal dirección de desarrollo en el futuro, por lo que los usuarios empresariales serán naturalmente más activos en la nube.
Al mismo tiempo, la potencia de cómputo de la IA en la nube no se quedará solo en el nivel de acaparamiento de las GPU de NVIDIA. A continuación, es la tendencia general de que la potencia informática de IA independiente nacional se traslade a la nube. Impulsados por políticas relevantes, los proveedores de la nube están aumentando la adquisición de chips de IA independientes. Según datos de IDC, en el primer semestre de 2023 se han utilizado 500.000 chips aceleradores de IA de desarrollo propio en los servidores de IA de China. En cuanto a la servitización de la potencia informática autónoma de la IA, HUAWEI CLOUD ha lanzado el servicio en la nube Ascend AI. La potencia informática de la IA, que combina la nube y la autonomía, se desarrollará en gran medida en el contexto de la prohibición de los chips de IA.
Además, en los últimos años, se han establecido una gran cantidad de centros de computación de IA que utilizan potencia de computación de IA independiente en varios lugares en el contexto de Eastern Data y Western Computing y, en general, la potencia de computación de IA en la nube de China es estable y confiable.
Sin embargo, muchas empresas siguen prefiriendo comprar potencia informática de IA local. Por un lado, esto se debe a que el mercado de GPU NVIDIA es escaso, y la retención de valor es particularmente buena, e incluso se puede utilizar como el activo principal de la empresa. Por otro lado, la potencia informática de la IA en la nube suele tener problemas como las colas, el tiempo de inactividad y la falta de servicios de software.
Cómo mejorar aún más la experiencia de los desarrolladores que utilizan la potencia de la computación de IA en la nube es la próxima dirección en la que deben centrarse los proveedores de nube pública.
Solución 3: Deje que el poder de cómputo de IA nacional crezca explosivamente
Ante una nueva ronda de prohibición de chips de IA, ¿cuál es la mayor confianza de la industria de IA de China? ¿Es un hábito después de muchos años, o hay un excedente de comida en casa después de una gran cantidad de tunka? Tampoco. El nodo más crítico es que, después de años de desarrollo, la industria de chips de IA de China se ha desarrollado enormemente. Las GPU de gama alta de Nvidia siguen siendo importantes, pero no es que no haya alternativa.
Según los datos publicados anteriormente por IDC, los envíos de tarjetas aceleradoras de IA de China en 2022 serán de unos 1,09 millones, de los cuales la cuota de mercado de Nvidia alcanzará el 85%, la cuota de mercado de Ascend Reality de Huawei alcanzará el 10%, la de Baidu Kunlun será del 2% y Cambrian y Suiyuan Technology serán del 1%.
Se puede ver que el poder de cómputo de la IA nacional ha alcanzado un cierto grado de participación de mercado, no solo "sobre el papel" en conceptos y teorías. Al mismo tiempo, también hay que tener en cuenta que los chips de IA nacionales todavía no son ideales en términos de rendimiento central, ecología de software y capacidad de envío, y todavía queda un largo camino por recorrer. Bajo las condiciones objetivas de la prohibición de NVIDIA, la potencia de cómputo de IA nacional debe superar estas dificultades a corto plazo y acelerar su propio ciclo de crecimiento y madurez.
Para lograr este objetivo, varias cosas son muy importantes:
**1. Formar un consenso de la industria para evitar la confusión de conceptos. **
Cuando se trata de chips de IA, a menudo decimos que tiene muchas formas de implementarlo, y hay muchas marcas independientes que participan en este mercado, que parece ser próspero. Por ejemplo, los chips de IA incluyen GPU, FPGA, ASIC, integración de almacenamiento y computación y chips similares al cerebro, etc., y los fabricantes nacionales de chips de aceleración de IA incluyen Alibaba, Baidu, Huawei, Cambrian, Haiguang Information, Suiyuan Technology, Tiantian Zhixin, Biqian Technology, Moore Threads, Loongson Zhongke, etc.
Este tipo de "prosperidad" no solo es confusa en la opinión pública y en el mercado de inversiones, sino que también aparece a menudo en algunos informes de la industria y análisis de políticas. Pero el problema es que la definición de chips de IA generalmente está sobrecargada. Por ejemplo, los chips similares al cerebro son solo imaginaciones técnicas en el futuro previsible, y si se agregan chips similares al cerebro cada vez que se discuten los chips de IA nacionales, solo perderá tiempo y distraerá energía. Otro ejemplo es que algunos fabricantes de chips de IA solo pueden fabricar chips para su propio uso y no pueden enviarlos al mercado. Algunos proveedores aún no tienen la capacidad de comercializar y se encuentran en la etapa inicial de construcción, y su contribución a la autonomía de la computación de IA a corto plazo es muy pequeña.
Para hacer frente a la prohibición de las GPU de gama alta de Nvidia, tenemos que centrarnos en alternativas de GPU viables y eficaces, en lugar de hacer demasiadas asociaciones y divergencias. Sólo formando este consenso industrial podremos reunir fuerzas para resolver el problema. **
**2. Avanzar hacia el uso comercial a gran escala y evitar la fabricación de núcleos PPT. **
De hecho, no importa desde la perspectiva de los chips de aceleración de IA o las máquinas de servidor, hay muy pocos fabricantes de chips de IA que puedan realizar envíos en China. Concentrados principalmente en Huawei y Baidu, Suiyuan Technology y Haiguang Information también tienen ciertos envíos. Un gran número de fabricantes de semiconductores y empresas de IA siguen atascados en el plan y la visión de construir chips. Esto ha llevado al estancamiento de una gran cantidad de chips de IA nacionales que se han visto respaldados por las políticas y las expectativas del mercado de inversión, e incluso existe la sospecha de quedarse en esta etapa para disfrutar de los dividendos del mercado financiero.
** La próxima orientación de la industria debe pasar del establecimiento de chips de IA al envío de chips de IA, ayudar a los fabricantes de chips de IA a obtener comentarios comerciales directos, aceptar pruebas de mercado de productos y capacidad de producción, y dar forma gradualmente a un flujo de caja positivo. **
Fortalecer el ecosistema de software y fortalecer las capacidades de migración. **
La razón por la que la GPU NVIDIA es importante no es solo en el rendimiento del hardware, sino también en las capacidades ecológicas del software con CUDA y PyTorch como núcleo, por lo que el desarrollo de chips de IA domésticos no debe subestimar la capacidad del software. Al mismo tiempo que se fortalece la construcción del ecosistema de software independiente, también es necesario prestar atención a la capacidad de migración y al costo de migración de la creación de modelos de IA basados en el ecosistema de NVIDIA.
Con este fin, un gran número de fabricantes han estado explorando, como la DCU de Haiguang Information, que es muy similar a CUDA en términos de ecología y entorno de programación, y los usuarios de CUDA pueden migrar rápidamente a la plataforma ROCm de Haiguang a bajo costo. Anteriormente, PyTorch 2.1 anunció soporte para Ascend de Huawei. Se puede ver que los chips de IA nacionales tienen una cierta influencia a escala y pueden integrarse más en el ecosistema global de software.
** En el futuro, si desea darse cuenta de la explosión de la computación de IA doméstica, no puede dejar el brote de la ecología de software básico de IA doméstica. **
Aumentar el apoyo a la "marca principal" y formar un efecto a gran escala. **
Para los chips de IA estadounidenses, además de las GPU NVIDIA, ¿qué más sabes? Incluso si esta pregunta se hace a algunos desarrolladores de IA, la respuesta es en gran medida poco clara o no se ha probado. Se puede ver que la computación de IA, al igual que la computación general y la computación gráfica, tiene una alta probabilidad de que aparezcan una o dos "marcas principales". Esto pertenece a la ley objetiva del mercado, y no hay necesidad de lograr una situación de "dejar florecer cien flores" en la forma de arrancar plántulas para ayudarlas a crecer.
Incluso en la medida en que la computación de IA de China debe acelerar su madurez y completar el objetivo de la sustitución autónoma, es bueno lograr una situación de uno súper y muchos fuertes lo antes posible. Esto puede evitar la fragmentación ecológica y el desperdicio de una gran cantidad de inversión en TI causada por el vaivén de la industria. Este proceso debe dejarse en manos del mercado, tomando forma lentamente. Sin embargo, en el contexto de la prohibición de los chips, el auge de la computación de IA nacional ha llegado a su fin, en lugar de dejar que 100 tipos de chips de IA maduren lentamente y se mezclen lentamente, como acelerar la formación de una situación de reemplazo rápido de las "marcas principales".
A juzgar por la situación actual, Ascend es la fuerza con más probabilidades de convertirse en la principal marca de potencia informática de IA nacional. Liu Qingfeng, fundador y presidente de iFLYTEK, dijo anteriormente que la GPU de Huawei ha sido comparada con la NVIDIA A100. Según los datos, la potencia de cálculo de precisión entera del Ascend 310 alcanza los 16 TOPS, y la potencia de cálculo de precisión entera del Ascend 910 alcanza los 640 TOPS. Esto significa que el rendimiento de la Ascend 910 es similar al de la NVIDIA A100.
Al mismo tiempo, Ascend es actualmente la única potencia informática de IA nacional que tiene una cuota de mercado estable, y ha incubado una arquitectura de computación heterogénea CANN similar a NVIDIA CUDA y un marco de computación de IA MindSpore en software. En términos de rendimiento central, ecosistema de software y cuota de mercado, Ascend tiene la viabilidad de acelerar el crecimiento y realizar la localización a gran escala de la potencia informática de la IA.
** La estandarización de los estándares de la industria, el fortalecimiento de la construcción de software y la mejora del soporte de las marcas independientes son las principales formas de promover el rápido crecimiento de la potencia informática de IA nacional a corto plazo. **
La prohibición de Nvidia es un problema que la industria china de la IA generalmente no quiere ver, tratar de evitar, e incluso hoy en día es un poco secreta. Sin embargo, la situación es más fuerte que las personas, y en el proceso acelerado de desglobalización y la carrera de la IA, existe una alta probabilidad de que prohibiciones similares sean mucho más probables en el futuro.
La evasión, el desvío y el silencio no pueden resolver el problema, y sólo afrontando con calma y esforzándonos por superarnos a nosotros mismos podemos resolver fundamentalmente el problema de ser controlados por los demás.
Bajo la prohibición, ¿hacia dónde va la computación de IA de China a partir de aquí?
La respuesta es que no tenemos otra opción, así que tenemos que darle al mundo una segunda opción.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Después de la prohibición de NVIDIA, ¿hacia dónde va la computación de IA de China?
Fuente original: Cuerpo polar del cerebro
El 17 de octubre, Estados Unidos reforzó la prohibición de los chips de IA para el mercado chino. Entre ellos, el rendimiento y la densidad se consideran claramente normas de control de las exportaciones, y los chips con una potencia de cálculo de más de 300 teraflops por chip y una densidad de rendimiento de más de 370 gigaflops por milímetro cuadrado están incluidos en la lista de exportaciones prohibidas.
Aunque bajo esta prohibición, los chips de IA de gama alta proporcionados por AMD, Intel y otras empresas también se ven afectados. Sin embargo, debido al dominio de Nvidia en el campo global de los chips de IA, esta prohibición implica el entrenamiento de la IA convencional de las GPU NVIDIA como A100 y H100, por lo que esta prohibición de chips también se conoce como la "prohibición de NVIDIA".
Tan pronto como salió la noticia, inmediatamente despertó acaloradas discusiones en la industria de la IA. Sin embargo, la mayor parte de la discusión se centró en cuándo se implementará la prohibición, si hay una zona de amortiguamiento, qué modelos de GPU están involucrados y cuánto durará la prohibición. Esto lleva a un trasfondo macro obvio que se ha pasado por alto: aunque la relación económica y comercial entre China y Estados Unidos ha fluctuado de vez en cuando desde el estallido de la fricción comercial, el control de chips para China siempre ha aumentado sin cesar. En particular, la prohibición de los chips de IA de gama alta se ha aplicado firmemente en muchas controversias.
Llegados a este punto, parece que la industria de la IA tiene que formar un consenso básico: abandonar las ilusiones y prepararse para la lucha.
En lugar de preocuparse por qué GPU están prohibidas, si es posible levantar la prohibición. ¿Por qué no reexamina hacia dónde se dirige la computación de IA de China en la era de la Cortina de Hierro de los chips?
En este artículo, esperamos partir de la situación actual de la industria y pensar en el camino a seguir para la computación con IA.
Situación actual
En primer lugar, debemos entender una pregunta, es decir, por qué después de la introducción de la prohibición de NVIDIA, la reacción de la opinión pública y de la industria de la IA no fue tan grave como lo fue al comienzo del bloqueo de chips en 18 o 19. Parece que solo la cuestión de si la tarjeta gráfica de consumo RTX 4090 está prohibida ha provocado cierto debate entre los jugadores y los comerciantes relacionados.
La lógica macro detrás de esto es que la industria es muy reacia a que se prohíban los chips de IA de gama alta, pero de hecho, esta situación se esperaba desde hace mucho tiempo. Por un lado, Estados Unidos ha promovido el bloqueo de chips en China durante muchos años, y algunas de las GPU de gama alta de Nvidia han sido prohibidas, y los comentarios de la industria se han ajustado durante mucho tiempo de la conmoción a la calma. Además, tras la explosión de ChatGPT, el mercado mundial de GPU de gama alta ha aumentado considerablemente este año, seguido de las repetidas declaraciones de Estados Unidos para promover la prohibición general de la venta de chips de IA de gama alta a China. Después de unos meses, no es diferente finalmente caer un martillo.
Para hacer frente a esta previsible prohibición, y al mismo tiempo hay una promoción objetiva del desarrollo de modelos grandes, desde finales del año pasado hasta la primera mitad de este año, un gran número de empresas chinas en los campos de la ciencia y la tecnología, las finanzas y los automóviles se concentraron en almacenar las GPU de gama alta de Nvidia, lo que ha provocado una situación en la que es difícil encontrar una tarjeta en el mercado. En otras palabras, para muchas pequeñas y medianas empresas tecnológicas chinas y nuevas empresas de IA, las GPU de gama alta no se pueden comprar, y no ha cambiado mucho desde la prohibición.
Otra realidad es que los chips de IA de gama alta no son imposibles de localizar. Ya 18 y 19 años después del inicio de las fricciones comerciales, la industria nacional de chips de IA aceleró su desarrollo. Esto lleva al hecho de que en términos de necesidades de entrenamiento de IA, aunque las GPU de gama alta de NVIDIA son difíciles de reemplazar, no son insustituibles.
Además, los chips de IA no son tan relevantes para los consumidores masivos como los chips de teléfonos móviles, y Huawei ha hecho un gran avance en los chips de teléfonos móviles. Todo tipo de señales se han combinado para hacer que tanto el público como la industria tengan una mentalidad tranquila, incluso un poco extraña, sobre esta prohibición.
Pero hay que tener en cuenta objetivamente que esta prohibición no es en absoluto inofensiva para la industria china de la IA. Por un lado, es muy difícil sustituir a las GPU de NVIDIA a corto plazo, tanto en términos de capacidad de producción de chips como de compatibilidad ecológica. Y la prohibición también causará un daño directo a los fabricantes que utilizan productos NVIDIA a gran escala en áreas como los servidores de IA.
La cuestión más crítica es que en el futuro, si la prohibición persiste durante mucho tiempo, la computación de IA de China se desacoplará gradualmente de los chips de gama alta del mundo, y los posibles efectos negativos a largo plazo son muy complejos, como:
¿Los chips de IA representados por las GPU de gama alta de NVIDIA causarán una desconexión en el desarrollo de la potencia de cálculo de IA de China después de ser actualizados e iterados?
Después del desarrollo de la divergencia de potencia de cálculo subyacente, ¿se quedará atrás la industria de IA de China en el desarrollo de tecnologías de software como los grandes modelos?
Esta prohibición de los chips de IA ha mostrado las características de los bloqueos a gran escala. ¿Realmente este bloqueo tecnológico se quedará solo en el campo de los chips de IA? ¿Se convertirán las capacidades básicas digitales, como la potencia informática general, el almacenamiento y el software básico, en los próximos objetivos?
Con todo, la prohibición de los chips de IA es un juego preparado para China, no un ataque sorpresa. Si quieres superar con éxito este nivel, también debes jugar bien todas las cartas de tu mano y jugarlas juntas, para reducir la intensidad del daño y aumentar la tasa de ganancias a largo plazo.
En la actualidad, la computación de IA de China tiene tres "planes innovadores" en los que se debe trabajar al mismo tiempo.
Opción 1: Hacer un buen uso de la identidad del "comprador"
Hay una verdad simple, la lógica del comportamiento del mercado comercial está determinada por la oferta y la demanda. Sin embargo, en el comercio de tecnología entre China y Estados Unidos, representado por los chips, a menudo caemos en un error de pensamiento: pensamos que la mayoría de las reglas del juego las establecen el gobierno y las empresas estadounidenses, y quieren vendernos, compraremos y no querrán comprarnos.
Como el mayor "comprador" del mercado mundial de chips, las empresas chinas no tienen derecho a hablar, lo cual es muy absurdo.
De hecho, la prohibición de los chips de IA en el mercado chino ha perjudicado directamente a los gigantes tecnológicos estadounidenses representados por Nvidia. En la actualidad, la mayor demanda del mercado de chips de IA de NVIDIA proviene de China. Anteriormente, el CEO de Nvidia, Jensen Huang, dejó claro que "si nos privan del mercado chino, no tenemos medidas de emergencia, y no hay otra China en el mundo".
En este contexto, podemos ver una aguda contradicción entre las empresas tecnológicas estadounidenses, que persiguen intereses comerciales, y el gobierno de Estados Unidos, que persigue intereses políticos. Las empresas tecnológicas estadounidenses siempre están buscando formas de oponerse y eludir la prohibición, como Nvidia, que lanzó una versión específica de China de la GPU en respuesta al embargo el año pasado.
El mercado chino digiere alrededor de un tercio de la capacidad de producción de las empresas tecnológicas estadounidenses, y el vínculo entre la oferta y la demanda entre ambos no puede romperse durante mucho tiempo. Frente a la prohibición general de la tecnología cada vez más obvia en los Estados Unidos, el mercado chino también debería hacer un buen uso activo de su condición de "comprador" para hacer que su propio comportamiento sea más distinto y predecible.
Evite crear una especie de rendimiento e impresión de "bienvenido si vende, solo indefenso si no vende".
La "identidad del comprador" debe ser aquella que tenga una posición, poder y enojo.
Esquema 2: Reemplace la tarjeta con la nube y el poder de cómputo se concentrará
Durante un largo período de tiempo, la prohibición de EE. UU. sobre los chips de IA de China solo puede fortalecerse, y este momento coincide con la etapa crítica del desarrollo de grandes modelos de IA. Muchas personas en la industria creen que, aunque el desarrollo de grandes modelos es rápido, no ha mostrado antes la rápida situación de otros puntos de venta científicos y tecnológicos, y la falta de dinero para la inversión y la falta de tarjetas para la computación son las principales razones.
Entonces, ¿cómo resolver el problema de la brecha de poder de cómputo en la industria de IA de China bajo la prohibición? El primer plan de contingencia es que las empresas aumenten la asignación y la inversión de la potencia de computación de IA en la nube y promuevan el uso de la nube para reemplazar las tarjetas.
De hecho, bajo la tendencia general de que los chips de IA de gama alta pueden ser prohibidos, varios de los principales fabricantes de nube pública en China han tomado medidas para aumentar su acaparamiento de las GPU de gama alta de Nvidia. Por un lado, esto se debe a que los propios proveedores de la nube necesitan aumentar la inversión en modelos grandes y abrir el mercado de MaaS, por lo que existe una demanda directa de potencia informática de IA. Por otro lado, también se debe a que las GPU se pueden reutilizar durante mucho tiempo después de ser convertidas en grupos de recursos en la nube, que es una situación en la que los proveedores de la nube pueden atacar y retirarse. Por lo tanto, en la primera mitad de este año, hubo una situación en la que todos los chips de IA de gama alta del mercado fluyeron hacia los fabricantes de la nube, y fue difícil para las pequeñas y medianas empresas encontrar una tarjeta.
Desde un punto de vista objetivo, este traslado de chips de IA de alta gama a la nube es beneficioso para todo el mercado chino para hacer frente a la prohibición de los chips de IA, y también está en línea con el pensamiento estratégico de Eastern Data y Western Computing.
Otra tendencia que es buena para la potencia de computación de IA en la nube es el creciente número de parámetros de modelos grandes y la cantidad de datos utilizados. El entrenamiento localizado del grupo de cartas se ha vuelto cada vez más estricto. El entrenamiento de kilocalorías y 10.000 calorías que debe realizarse en la nube se ha convertido en la principal dirección de desarrollo en el futuro, por lo que los usuarios empresariales serán naturalmente más activos en la nube.
Al mismo tiempo, la potencia de cómputo de la IA en la nube no se quedará solo en el nivel de acaparamiento de las GPU de NVIDIA. A continuación, es la tendencia general de que la potencia informática de IA independiente nacional se traslade a la nube. Impulsados por políticas relevantes, los proveedores de la nube están aumentando la adquisición de chips de IA independientes. Según datos de IDC, en el primer semestre de 2023 se han utilizado 500.000 chips aceleradores de IA de desarrollo propio en los servidores de IA de China. En cuanto a la servitización de la potencia informática autónoma de la IA, HUAWEI CLOUD ha lanzado el servicio en la nube Ascend AI. La potencia informática de la IA, que combina la nube y la autonomía, se desarrollará en gran medida en el contexto de la prohibición de los chips de IA.
Además, en los últimos años, se han establecido una gran cantidad de centros de computación de IA que utilizan potencia de computación de IA independiente en varios lugares en el contexto de Eastern Data y Western Computing y, en general, la potencia de computación de IA en la nube de China es estable y confiable.
Sin embargo, muchas empresas siguen prefiriendo comprar potencia informática de IA local. Por un lado, esto se debe a que el mercado de GPU NVIDIA es escaso, y la retención de valor es particularmente buena, e incluso se puede utilizar como el activo principal de la empresa. Por otro lado, la potencia informática de la IA en la nube suele tener problemas como las colas, el tiempo de inactividad y la falta de servicios de software.
Cómo mejorar aún más la experiencia de los desarrolladores que utilizan la potencia de la computación de IA en la nube es la próxima dirección en la que deben centrarse los proveedores de nube pública.
Solución 3: Deje que el poder de cómputo de IA nacional crezca explosivamente
Ante una nueva ronda de prohibición de chips de IA, ¿cuál es la mayor confianza de la industria de IA de China? ¿Es un hábito después de muchos años, o hay un excedente de comida en casa después de una gran cantidad de tunka? Tampoco. El nodo más crítico es que, después de años de desarrollo, la industria de chips de IA de China se ha desarrollado enormemente. Las GPU de gama alta de Nvidia siguen siendo importantes, pero no es que no haya alternativa.
Según los datos publicados anteriormente por IDC, los envíos de tarjetas aceleradoras de IA de China en 2022 serán de unos 1,09 millones, de los cuales la cuota de mercado de Nvidia alcanzará el 85%, la cuota de mercado de Ascend Reality de Huawei alcanzará el 10%, la de Baidu Kunlun será del 2% y Cambrian y Suiyuan Technology serán del 1%.
Se puede ver que el poder de cómputo de la IA nacional ha alcanzado un cierto grado de participación de mercado, no solo "sobre el papel" en conceptos y teorías. Al mismo tiempo, también hay que tener en cuenta que los chips de IA nacionales todavía no son ideales en términos de rendimiento central, ecología de software y capacidad de envío, y todavía queda un largo camino por recorrer. Bajo las condiciones objetivas de la prohibición de NVIDIA, la potencia de cómputo de IA nacional debe superar estas dificultades a corto plazo y acelerar su propio ciclo de crecimiento y madurez.
Para lograr este objetivo, varias cosas son muy importantes:
**1. Formar un consenso de la industria para evitar la confusión de conceptos. **
Cuando se trata de chips de IA, a menudo decimos que tiene muchas formas de implementarlo, y hay muchas marcas independientes que participan en este mercado, que parece ser próspero. Por ejemplo, los chips de IA incluyen GPU, FPGA, ASIC, integración de almacenamiento y computación y chips similares al cerebro, etc., y los fabricantes nacionales de chips de aceleración de IA incluyen Alibaba, Baidu, Huawei, Cambrian, Haiguang Information, Suiyuan Technology, Tiantian Zhixin, Biqian Technology, Moore Threads, Loongson Zhongke, etc.
Este tipo de "prosperidad" no solo es confusa en la opinión pública y en el mercado de inversiones, sino que también aparece a menudo en algunos informes de la industria y análisis de políticas. Pero el problema es que la definición de chips de IA generalmente está sobrecargada. Por ejemplo, los chips similares al cerebro son solo imaginaciones técnicas en el futuro previsible, y si se agregan chips similares al cerebro cada vez que se discuten los chips de IA nacionales, solo perderá tiempo y distraerá energía. Otro ejemplo es que algunos fabricantes de chips de IA solo pueden fabricar chips para su propio uso y no pueden enviarlos al mercado. Algunos proveedores aún no tienen la capacidad de comercializar y se encuentran en la etapa inicial de construcción, y su contribución a la autonomía de la computación de IA a corto plazo es muy pequeña.
Para hacer frente a la prohibición de las GPU de gama alta de Nvidia, tenemos que centrarnos en alternativas de GPU viables y eficaces, en lugar de hacer demasiadas asociaciones y divergencias. Sólo formando este consenso industrial podremos reunir fuerzas para resolver el problema. **
**2. Avanzar hacia el uso comercial a gran escala y evitar la fabricación de núcleos PPT. **
De hecho, no importa desde la perspectiva de los chips de aceleración de IA o las máquinas de servidor, hay muy pocos fabricantes de chips de IA que puedan realizar envíos en China. Concentrados principalmente en Huawei y Baidu, Suiyuan Technology y Haiguang Information también tienen ciertos envíos. Un gran número de fabricantes de semiconductores y empresas de IA siguen atascados en el plan y la visión de construir chips. Esto ha llevado al estancamiento de una gran cantidad de chips de IA nacionales que se han visto respaldados por las políticas y las expectativas del mercado de inversión, e incluso existe la sospecha de quedarse en esta etapa para disfrutar de los dividendos del mercado financiero.
** La próxima orientación de la industria debe pasar del establecimiento de chips de IA al envío de chips de IA, ayudar a los fabricantes de chips de IA a obtener comentarios comerciales directos, aceptar pruebas de mercado de productos y capacidad de producción, y dar forma gradualmente a un flujo de caja positivo. **
La razón por la que la GPU NVIDIA es importante no es solo en el rendimiento del hardware, sino también en las capacidades ecológicas del software con CUDA y PyTorch como núcleo, por lo que el desarrollo de chips de IA domésticos no debe subestimar la capacidad del software. Al mismo tiempo que se fortalece la construcción del ecosistema de software independiente, también es necesario prestar atención a la capacidad de migración y al costo de migración de la creación de modelos de IA basados en el ecosistema de NVIDIA.
Con este fin, un gran número de fabricantes han estado explorando, como la DCU de Haiguang Information, que es muy similar a CUDA en términos de ecología y entorno de programación, y los usuarios de CUDA pueden migrar rápidamente a la plataforma ROCm de Haiguang a bajo costo. Anteriormente, PyTorch 2.1 anunció soporte para Ascend de Huawei. Se puede ver que los chips de IA nacionales tienen una cierta influencia a escala y pueden integrarse más en el ecosistema global de software.
** En el futuro, si desea darse cuenta de la explosión de la computación de IA doméstica, no puede dejar el brote de la ecología de software básico de IA doméstica. **
Para los chips de IA estadounidenses, además de las GPU NVIDIA, ¿qué más sabes? Incluso si esta pregunta se hace a algunos desarrolladores de IA, la respuesta es en gran medida poco clara o no se ha probado. Se puede ver que la computación de IA, al igual que la computación general y la computación gráfica, tiene una alta probabilidad de que aparezcan una o dos "marcas principales". Esto pertenece a la ley objetiva del mercado, y no hay necesidad de lograr una situación de "dejar florecer cien flores" en la forma de arrancar plántulas para ayudarlas a crecer.
Incluso en la medida en que la computación de IA de China debe acelerar su madurez y completar el objetivo de la sustitución autónoma, es bueno lograr una situación de uno súper y muchos fuertes lo antes posible. Esto puede evitar la fragmentación ecológica y el desperdicio de una gran cantidad de inversión en TI causada por el vaivén de la industria. Este proceso debe dejarse en manos del mercado, tomando forma lentamente. Sin embargo, en el contexto de la prohibición de los chips, el auge de la computación de IA nacional ha llegado a su fin, en lugar de dejar que 100 tipos de chips de IA maduren lentamente y se mezclen lentamente, como acelerar la formación de una situación de reemplazo rápido de las "marcas principales".
A juzgar por la situación actual, Ascend es la fuerza con más probabilidades de convertirse en la principal marca de potencia informática de IA nacional. Liu Qingfeng, fundador y presidente de iFLYTEK, dijo anteriormente que la GPU de Huawei ha sido comparada con la NVIDIA A100. Según los datos, la potencia de cálculo de precisión entera del Ascend 310 alcanza los 16 TOPS, y la potencia de cálculo de precisión entera del Ascend 910 alcanza los 640 TOPS. Esto significa que el rendimiento de la Ascend 910 es similar al de la NVIDIA A100.
Al mismo tiempo, Ascend es actualmente la única potencia informática de IA nacional que tiene una cuota de mercado estable, y ha incubado una arquitectura de computación heterogénea CANN similar a NVIDIA CUDA y un marco de computación de IA MindSpore en software. En términos de rendimiento central, ecosistema de software y cuota de mercado, Ascend tiene la viabilidad de acelerar el crecimiento y realizar la localización a gran escala de la potencia informática de la IA.
** La estandarización de los estándares de la industria, el fortalecimiento de la construcción de software y la mejora del soporte de las marcas independientes son las principales formas de promover el rápido crecimiento de la potencia informática de IA nacional a corto plazo. **
La prohibición de Nvidia es un problema que la industria china de la IA generalmente no quiere ver, tratar de evitar, e incluso hoy en día es un poco secreta. Sin embargo, la situación es más fuerte que las personas, y en el proceso acelerado de desglobalización y la carrera de la IA, existe una alta probabilidad de que prohibiciones similares sean mucho más probables en el futuro.
La evasión, el desvío y el silencio no pueden resolver el problema, y sólo afrontando con calma y esforzándonos por superarnos a nosotros mismos podemos resolver fundamentalmente el problema de ser controlados por los demás.
Bajo la prohibición, ¿hacia dónde va la computación de IA de China a partir de aquí?
La respuesta es que no tenemos otra opción, así que tenemos que darle al mundo una segunda opción.