En la era actual de rápido desarrollo tecnológico, ChatGPT de OpenAI se ha convertido sin duda en una estrella brillante en el campo de la inteligencia artificial. Sin embargo, con el aumento en el número de sus usuarios, ha surgido gradualmente un problema que no se puede ignorar: la escasez de potencia informática. Esto no es solo un desafío para OpenAI, sino un problema para toda la industria de la IA.
En este análisis en profundidad, exploraremos las causas fundamentales de la escasez de potencia informática y cómo afecta al desarrollo de grandes modelos y al futuro de la industria. Al mismo tiempo, también exploraremos posibles formas de abordar este problema, incluido el desarrollo de GPU nacionales y su posible impacto en el mercado global.
La escasez de potencia de cálculo ha estado afectando a OpenAI
La escasez de potencia de cálculo siempre ha sido un problema espinoso al que OpenAI tiene que hacer frente en su rápido ascenso. Recientemente, este problema se ha vuelto más prominente debido a un incidente de alto perfil. OpenAI celebró un evento de exhibición a gran escala apodado la "Gala del Festival de Primavera de Ciencia y Tecnología", mostrando los últimos logros de su tecnología, que atrajo una gran atención en todo el mundo. Como resultado, una avalancha de usuarios acudió en masa a la plataforma de OpenAI, especialmente a su producto estrella, ChatGPT.
Sin embargo, hay un gran desafío detrás de esta locura. El crecimiento explosivo del número de usuarios ha superado rápidamente la capacidad de cálculo de OpenAI. Apenas dos días después de la conferencia, surgió un hecho impactante: el servidor de ChatGPT se bloqueó. Innumerables internautas han informado que no pueden utilizar las API proporcionadas por ChatGPT y OpenAI con normalidad.
Ante esta crisis, OpenAI tuvo que tomar una decisión que conmocionó al mercado: suspender el registro de nuevos usuarios de ChatGPT Plus. El coste económico de esta decisión es enorme, ya que 100 millones de nuevos usuarios generan 2.000 millones de dólares en ingresos al mes para OpenAI con una cuota de suscripción mensual de 20 dólares. Un beneficio potencial tan grande, pero tener que renunciar debido a la escasez de potencia de cómputo, es sin duda una elección extremadamente pasiva.
De hecho, la escasez de potencia de cómputo no es solo un fenómeno reciente. Desde el lanzamiento de ChatGPT, el tema de la potencia de cómputo ha sido una sombra persistente. Por ejemplo, en abril, ChatGPT Plus también se vio obligado a suspender la compra de artículos de pago. Esto sucede de vez en cuando, y parece haberse convertido en una norma en el camino del crecimiento de OpenAI.
Estos acontecimientos revelan un hecho indiscutible: en el contexto del desarrollo tecnológico actual, la potencia informática se ha convertido en un importante cuello de botella que limita la innovación tecnológica de la IA y la expansión de las aplicaciones comerciales. Para OpenAI, esto no es solo un desafío técnico, sino también estratégico. Cómo encontrar un equilibrio entre la demanda del mercado en rápida expansión y los recursos informáticos limitados se ha convertido en un problema difícil para OpenAI. Este desafío no solo tiene que ver con las ganancias a corto plazo de la empresa, sino también con su posición en el mercado a largo plazo y su liderazgo tecnológico.
La familia del terrateniente no tiene excedentes de grano
OpenAI ha anunciado en repetidas ocasiones que la potencia de cálculo no es suficiente.
Debes saber que OpenAI es una empresa estrella con grandes modelos, con una enorme financiación y una gran cantidad de recursos informáticos. Además, también hay un "padre de oro" Microsoft, que proporciona una gama completa de soporte de potencia informática. Microsoft tiene los segundos recursos de computación en la nube más grandes del mundo.
Desde este punto de vista, se puede decir que OpenAI es el "propietario" de la potencia de cómputo. Pero la realidad es que la familia del terrateniente no tiene excedentes de alimentos. Entonces, ¿por qué una empresa con una gran financiación y un fuerte respaldo como Microsoft se metió en esta situación?
Debemos reconocer que la demanda de potencia de cómputo para grandes modelos no tiene precedentes. Estos modelos se basan en cientos de miles de millones de redes neuronales, y cada cálculo es una gran prueba de potencia informática. En pocas palabras, ahora nos enfrentamos a un nivel completamente nuevo de necesidades informáticas que no se han igualado en la historia del desarrollo de software. Los recursos informáticos tradicionales, como las CPU, no son suficientes aquí, y la GPU, en la que hay que confiar, es sin duda la primera línea de esta revolución tecnológica.
El problema con las GPU, sin embargo, es que no solo son productos tecnológicos emergentes, sino que también enfrentan el doble desafío de la iteración del diseño y las limitaciones de capacidad. A pesar de la creciente demanda de GPU en el mundo de la tecnología, la capacidad mundial de fabricación de chips no ha seguido el ritmo. Los sistemas existentes de fabricación, empaquetado y prueba de semiconductores están diseñados principalmente en torno a las CPU, y para las GPU emergentes, obviamente no están completamente adaptados. Esto significa que todavía queda un largo camino por recorrer en términos de aumentar la capacidad de la GPU y adaptarse a las nuevas necesidades tecnológicas.
La tecnología de GPU continúa avanzando, y cada nueva generación se esfuerza por mejorar el rendimiento y la eficiencia, lo que requiere una inversión continua en investigación y desarrollo e innovación tecnológica. Sin embargo, esta iteración continua de la tecnología también significa un aumento de los costos de investigación y desarrollo, así como un aumento de la complejidad del proceso de fabricación.
Además de la cuestión de la capacidad de producción, el coste de las GPU también es una cuestión que no se puede ignorar. Para construir un clúster de computación GPU que pueda soportar la computación de modelos a gran escala, se requiere no solo tecnología, sino también una gran inversión de capital. Incluso para un gigante tecnológico como OpenAI, esto es una carga significativa. Encontrar un equilibrio entre costo y beneficio es una elección difícil.
Si incluso OpenAI está luchando con la escasez de potencia informática, ¿qué pasará con otras empresas? Esto no solo es un desafío para OpenAI, sino también para toda la industria de la IA. Lo que estamos presenciando es un gran cambio: un cambio de la computación tradicional a la computación impulsada por IA. En esta transformación, la potencia informática se ha convertido en el cuello de botella más crítico.
No podemos ignorar el hecho de que esta escasez no ocurrió de la noche a la mañana, sino que es el resultado de un desajuste entre los desarrollos tecnológicos a largo plazo y la demanda del mercado. Las limitaciones de producción, el desarrollo tecnológico y los problemas de costos de los chips de GPU son multifacéticos e involucran cadenas de suministro globales, innovaciones tecnológicas y modelos económicos. Los requisitos de alta potencia de cálculo de las aplicaciones de modelos grandes plantean desafíos sin precedentes a las arquitecturas tecnológicas existentes, lo que obliga a toda la industria a replantearse cómo diseñar, construir y optimizar los recursos informáticos.
Cuando la aplicación de extremo B se amplíe, el problema de la escasez de potencia de cálculo será más grave
Hay otro tema que es muy importante, pero que es fácil pasar por alto.
Cuando hablamos de la escasez de potencia de cálculo, solemos centrarnos en la experiencia de usuario actual del lado C. Sin embargo, esto es solo la punta del iceberg. Un problema aún más grave, pero que a menudo se pasa por alto, acecha en la escala de las aplicaciones del lado B. Por el momento, aunque los grandes modelos como ChatGPT atienden principalmente a los usuarios del extremo C, esto es solo el comienzo. Con el crecimiento gradual y la madurez de las aplicaciones B-end, nos enfrentaremos a un aumento sin precedentes en la demanda de potencia informática.
En el mercado chino, esta tendencia ya está empezando a surgir. Aunque productos como Baidu Wenxin Yiyan y Ali Tongyi Qianwen sirven actualmente principalmente a los usuarios de extremo C, su exploración de aplicaciones de extremo B ya está en camino. En la actualidad, la mayoría de estos productos se encuentran en la etapa de desarrollo de productos, pero una vez que entren en la etapa comercial a gran escala, la situación será completamente diferente. La complejidad del negocio de la cara B es mucho mayor que la de la cara C. En el lado C, la interacción del usuario con el sistema suele ser tan simple como la ejecución de consultas o comandos. Sin embargo, en el lado B, cada proceso de negocio puede implicar procesos más complejos de procesamiento de datos, análisis y toma de decisiones. Estos procesos no solo requieren más recursos informáticos, sino que también tienen mayores requisitos para la calidad y estabilidad de la potencia informática.
Lo que es más notable es que el consumo de potencia de cómputo de los servicios B-end no solo se refleja en la complejidad de una sola interacción, sino también en la frecuencia de las llamadas. En el lado B, la aplicación de modelos grandes tiende a ser continua y de alta frecuencia, en contraste con la consulta y el uso ocasional en el lado C. Por ejemplo, en sectores como el financiero, el sanitario y el manufacturero, los modelos de gran tamaño necesitan procesar continuamente grandes cantidades de datos para proporcionar análisis en tiempo real y apoyo a la toma de decisiones. Este tipo de demanda de computación de alta frecuencia y alta carga ejerce una enorme presión sobre la potencia de cómputo.
Es previsible que con la popularización de los grandes modelos en el lado B, su demanda de potencia de cálculo supere rápidamente a la del lado C. Este cambio puede ser sutil, pero su impacto es de gran alcance. Por un lado, el aumento de la demanda de potencia de cálculo impulsará el desarrollo de tecnologías relacionadas, como GPU más eficientes y arquitecturas informáticas más optimizadas. Por otro lado, también tendrá un impacto significativo en la asignación de recursos, la estructura de costos y el modelo de negocio de la industria en su conjunto.
En el proceso, es posible que veamos a algunas empresas obligadas a salir del mercado porque no pueden permitirse este coste de la potencia informática, o que algunas empresas se destaquen con tecnologías avanzadas de gestión y optimización de la potencia informática.
China se enfrenta a un doble cuello de botella en el poder de cómputo
A nivel mundial, la escasez de potencia informática se ha convertido en un importante cuello de botella en el desarrollo de la inteligencia artificial, y para China, este desafío es particularmente grave. Las empresas chinas de modelos a gran escala tienen que hacer frente no sólo a la escasez mundial de potencia informática («desastres naturales»), sino también a limitaciones únicas de la oferta del mercado («desastres provocados por el hombre»), lo que hace que las perspectivas de desarrollo de China en el campo de los grandes modelos sean complejas y desafiantes.
Debemos reconocer las limitaciones de las empresas modelo a gran escala de China en materia de recursos informáticos. Si bien empresas como Baidu, Alibaba, ByteDance, Tencent y Huawei han logrado logros notables en el desarrollo de grandes modelos, los desafíos informáticos a los que se enfrentan son reales y urgentes. En la actualidad, debido a la falta general de desarrollo de la industria mundial de GPU, las empresas chinas han encontrado grandes obstáculos para obtener suficientes recursos informáticos. Este tipo de problema de "desastre natural" es la única forma de desarrollo tecnológico y actualización industrial, y se necesita tiempo y una gran inversión para resolverlo.
Lo que es más complicado es que las empresas de modelos a gran escala de China también se enfrentan a "desastres provocados por el hombre" del mercado internacional, especialmente las limitaciones de suministro de gigantes internacionales como Nvidia al mercado chino. Esta restricción política ha afectado directamente a la capacidad de las empresas chinas para obtener chips de GPU de gama alta, lo que ha agravado la escasez de recursos informáticos. No cabe duda de que esta doble restricción ha añadido incertidumbres y desafíos adicionales al desarrollo de las empresas modelo a gran escala de China.
En la actualidad, aunque el número de usuarios de productos como Wenxin Yiyan de Baidu y Tongyi Qianwen de Alibaba no ha alcanzado la escala de los 100 millones de ChatGPT, esto no significa que las empresas chinas puedan hacer frente fácilmente a los desafíos informáticos existentes. Con el desarrollo de estos productos y la expansión del mercado, especialmente cuando comienzan a ser ampliamente utilizados en el mercado de gama B, la demanda de potencia informática aumentará drásticamente. En este momento, el problema de la escasez de potencia informática se volverá más prominente, lo que puede restringir seriamente el desarrollo de la gran industria de modelos de China.
A largo plazo, si China no puede hacer frente eficazmente a este doble cuello de botella informático, entonces el desarrollo de su gran industria de modelos puede limitarse a un nivel bajo. Esto no solo afectará la competitividad del mercado interno, sino que también limitará la influencia de China en el campo de la inteligencia artificial a escala global. Por lo tanto, resolver el problema de la escasez de potencia informática es crucial para el desarrollo futuro de la gran industria de modelos de China, que no es solo una cuestión técnica, sino también una cuestión estratégica, que está relacionada con la posición y el futuro de China en la competencia mundial de IA.
En medio de los desafíos informáticos duales a los que se enfrenta China, recientemente ha habido algunas señales positivas alentadoras, especialmente en el desarrollo de GPU nacionales. Las principales empresas nacionales de tecnología, como Baidu, Alibaba, 360, etc., han comenzado a cooperar con fabricantes nacionales de GPU como Huawei.
El aumento de las GPU domésticas tiene una importancia de gran alcance para resolver el problema de la escasez de potencia informática en China. Si estas GPU domésticas pueden ser comparables al líder de la industria, NVIDIA, en términos de rendimiento, y el cuello de botella a nivel de fabricación se resuelve de manera efectiva, esto brindará oportunidades sin precedentes a la gran industria de modelos de China. Históricamente, una vez que una tecnología nacional madura, generalmente puede ingresar al mercado a un precio más competitivo. Esto significa que si las GPU nacionales pueden tener éxito, es probable que ofrezcan un rendimiento similar o incluso mejor a un precio mucho más bajo que las marcas internacionales.
Esta ventaja de costos no solo aliviará la actual escasez de potencia informática, sino que también tiene el potencial de revolucionar el panorama del mercado. En la actualidad, el alto precio de las GPU ha sido un factor importante que limita la popularidad y la aplicación de la tecnología de modelos grandes. Si las GPU domésticas pueden proporcionar potencia informática de alto rendimiento a un precio más bajo, esto promoverá en gran medida la aplicación de la tecnología de modelos grandes en todos los ámbitos de la vida y acelerará el desarrollo de China en el campo de la inteligencia artificial.
Y lo que es más importante, este desarrollo podría permitir a China "convertir la derrota en victoria" en la carrera mundial de la IA. En términos de potencia y aplicaciones de computación de modelos a gran escala, China no solo puede ponerse al día, sino incluso superar a países líderes como Estados Unidos.
Por supuesto, todo esto aún está en el comienzo del desarrollo, y el éxito de las GPU domésticas aún debe superar los desafíos técnicos. Sin embargo, ha habido señales positivas de que China ha dado pasos sólidos en el camino hacia la autonomía informática. En los próximos años, se espera que seamos testigos de la madurez y la aplicación a gran escala de la tecnología de GPU nacional, y cómo promoverá el rápido desarrollo de la gran industria de modelos de China.
En resumen, en el viaje de exploración del desafío global de la escasez de potencia informática, no solo hemos sido testigos del avance continuo de los límites tecnológicos, sino que también hemos experimentado profundamente los complejos desafíos que enfrenta el desarrollo de la industria. Desde la historia de OpenAI hasta el doble dilema de las empresas de modelos a gran escala de China, pasando por el auge de la tecnología de GPU doméstica, todo esto revela una verdad fundamental: la potencia informática se ha convertido en un recurso estratégico clave en el futuro camino de desarrollo de la inteligencia artificial. No se trata solo de una competencia a nivel técnico, sino también de una inversión y un diseño de fuerzas científicas y tecnológicas globales para el futuro.
De cara al futuro, con los avances tecnológicos y la evolución de las demandas del mercado, tenemos razones para creer que el problema de la escasez de potencia informática acabará resolviéndose. En este proceso, la innovación, la cooperación y el ajuste estratégico serán los temas clave que todo participante deberá afrontar. En última instancia, este desafío de la potencia informática definirá el futuro de la tecnología de IA y dará forma a nuestro mundo digital.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
OpenAI está paralizada, ¿puede la tecnología negra de China salvar la IA global?
Fuente original: Data Ape
En la era actual de rápido desarrollo tecnológico, ChatGPT de OpenAI se ha convertido sin duda en una estrella brillante en el campo de la inteligencia artificial. Sin embargo, con el aumento en el número de sus usuarios, ha surgido gradualmente un problema que no se puede ignorar: la escasez de potencia informática. Esto no es solo un desafío para OpenAI, sino un problema para toda la industria de la IA.
En este análisis en profundidad, exploraremos las causas fundamentales de la escasez de potencia informática y cómo afecta al desarrollo de grandes modelos y al futuro de la industria. Al mismo tiempo, también exploraremos posibles formas de abordar este problema, incluido el desarrollo de GPU nacionales y su posible impacto en el mercado global.
La escasez de potencia de cálculo ha estado afectando a OpenAI
La escasez de potencia de cálculo siempre ha sido un problema espinoso al que OpenAI tiene que hacer frente en su rápido ascenso. Recientemente, este problema se ha vuelto más prominente debido a un incidente de alto perfil. OpenAI celebró un evento de exhibición a gran escala apodado la "Gala del Festival de Primavera de Ciencia y Tecnología", mostrando los últimos logros de su tecnología, que atrajo una gran atención en todo el mundo. Como resultado, una avalancha de usuarios acudió en masa a la plataforma de OpenAI, especialmente a su producto estrella, ChatGPT.
Sin embargo, hay un gran desafío detrás de esta locura. El crecimiento explosivo del número de usuarios ha superado rápidamente la capacidad de cálculo de OpenAI. Apenas dos días después de la conferencia, surgió un hecho impactante: el servidor de ChatGPT se bloqueó. Innumerables internautas han informado que no pueden utilizar las API proporcionadas por ChatGPT y OpenAI con normalidad.
Ante esta crisis, OpenAI tuvo que tomar una decisión que conmocionó al mercado: suspender el registro de nuevos usuarios de ChatGPT Plus. El coste económico de esta decisión es enorme, ya que 100 millones de nuevos usuarios generan 2.000 millones de dólares en ingresos al mes para OpenAI con una cuota de suscripción mensual de 20 dólares. Un beneficio potencial tan grande, pero tener que renunciar debido a la escasez de potencia de cómputo, es sin duda una elección extremadamente pasiva.
De hecho, la escasez de potencia de cómputo no es solo un fenómeno reciente. Desde el lanzamiento de ChatGPT, el tema de la potencia de cómputo ha sido una sombra persistente. Por ejemplo, en abril, ChatGPT Plus también se vio obligado a suspender la compra de artículos de pago. Esto sucede de vez en cuando, y parece haberse convertido en una norma en el camino del crecimiento de OpenAI.
Estos acontecimientos revelan un hecho indiscutible: en el contexto del desarrollo tecnológico actual, la potencia informática se ha convertido en un importante cuello de botella que limita la innovación tecnológica de la IA y la expansión de las aplicaciones comerciales. Para OpenAI, esto no es solo un desafío técnico, sino también estratégico. Cómo encontrar un equilibrio entre la demanda del mercado en rápida expansión y los recursos informáticos limitados se ha convertido en un problema difícil para OpenAI. Este desafío no solo tiene que ver con las ganancias a corto plazo de la empresa, sino también con su posición en el mercado a largo plazo y su liderazgo tecnológico.
La familia del terrateniente no tiene excedentes de grano
OpenAI ha anunciado en repetidas ocasiones que la potencia de cálculo no es suficiente.
Debes saber que OpenAI es una empresa estrella con grandes modelos, con una enorme financiación y una gran cantidad de recursos informáticos. Además, también hay un "padre de oro" Microsoft, que proporciona una gama completa de soporte de potencia informática. Microsoft tiene los segundos recursos de computación en la nube más grandes del mundo.
Desde este punto de vista, se puede decir que OpenAI es el "propietario" de la potencia de cómputo. Pero la realidad es que la familia del terrateniente no tiene excedentes de alimentos. Entonces, ¿por qué una empresa con una gran financiación y un fuerte respaldo como Microsoft se metió en esta situación?
Debemos reconocer que la demanda de potencia de cómputo para grandes modelos no tiene precedentes. Estos modelos se basan en cientos de miles de millones de redes neuronales, y cada cálculo es una gran prueba de potencia informática. En pocas palabras, ahora nos enfrentamos a un nivel completamente nuevo de necesidades informáticas que no se han igualado en la historia del desarrollo de software. Los recursos informáticos tradicionales, como las CPU, no son suficientes aquí, y la GPU, en la que hay que confiar, es sin duda la primera línea de esta revolución tecnológica.
El problema con las GPU, sin embargo, es que no solo son productos tecnológicos emergentes, sino que también enfrentan el doble desafío de la iteración del diseño y las limitaciones de capacidad. A pesar de la creciente demanda de GPU en el mundo de la tecnología, la capacidad mundial de fabricación de chips no ha seguido el ritmo. Los sistemas existentes de fabricación, empaquetado y prueba de semiconductores están diseñados principalmente en torno a las CPU, y para las GPU emergentes, obviamente no están completamente adaptados. Esto significa que todavía queda un largo camino por recorrer en términos de aumentar la capacidad de la GPU y adaptarse a las nuevas necesidades tecnológicas.
La tecnología de GPU continúa avanzando, y cada nueva generación se esfuerza por mejorar el rendimiento y la eficiencia, lo que requiere una inversión continua en investigación y desarrollo e innovación tecnológica. Sin embargo, esta iteración continua de la tecnología también significa un aumento de los costos de investigación y desarrollo, así como un aumento de la complejidad del proceso de fabricación.
Además de la cuestión de la capacidad de producción, el coste de las GPU también es una cuestión que no se puede ignorar. Para construir un clúster de computación GPU que pueda soportar la computación de modelos a gran escala, se requiere no solo tecnología, sino también una gran inversión de capital. Incluso para un gigante tecnológico como OpenAI, esto es una carga significativa. Encontrar un equilibrio entre costo y beneficio es una elección difícil.
Si incluso OpenAI está luchando con la escasez de potencia informática, ¿qué pasará con otras empresas? Esto no solo es un desafío para OpenAI, sino también para toda la industria de la IA. Lo que estamos presenciando es un gran cambio: un cambio de la computación tradicional a la computación impulsada por IA. En esta transformación, la potencia informática se ha convertido en el cuello de botella más crítico.
No podemos ignorar el hecho de que esta escasez no ocurrió de la noche a la mañana, sino que es el resultado de un desajuste entre los desarrollos tecnológicos a largo plazo y la demanda del mercado. Las limitaciones de producción, el desarrollo tecnológico y los problemas de costos de los chips de GPU son multifacéticos e involucran cadenas de suministro globales, innovaciones tecnológicas y modelos económicos. Los requisitos de alta potencia de cálculo de las aplicaciones de modelos grandes plantean desafíos sin precedentes a las arquitecturas tecnológicas existentes, lo que obliga a toda la industria a replantearse cómo diseñar, construir y optimizar los recursos informáticos.
Cuando la aplicación de extremo B se amplíe, el problema de la escasez de potencia de cálculo será más grave
Hay otro tema que es muy importante, pero que es fácil pasar por alto.
Cuando hablamos de la escasez de potencia de cálculo, solemos centrarnos en la experiencia de usuario actual del lado C. Sin embargo, esto es solo la punta del iceberg. Un problema aún más grave, pero que a menudo se pasa por alto, acecha en la escala de las aplicaciones del lado B. Por el momento, aunque los grandes modelos como ChatGPT atienden principalmente a los usuarios del extremo C, esto es solo el comienzo. Con el crecimiento gradual y la madurez de las aplicaciones B-end, nos enfrentaremos a un aumento sin precedentes en la demanda de potencia informática.
En el mercado chino, esta tendencia ya está empezando a surgir. Aunque productos como Baidu Wenxin Yiyan y Ali Tongyi Qianwen sirven actualmente principalmente a los usuarios de extremo C, su exploración de aplicaciones de extremo B ya está en camino. En la actualidad, la mayoría de estos productos se encuentran en la etapa de desarrollo de productos, pero una vez que entren en la etapa comercial a gran escala, la situación será completamente diferente. La complejidad del negocio de la cara B es mucho mayor que la de la cara C. En el lado C, la interacción del usuario con el sistema suele ser tan simple como la ejecución de consultas o comandos. Sin embargo, en el lado B, cada proceso de negocio puede implicar procesos más complejos de procesamiento de datos, análisis y toma de decisiones. Estos procesos no solo requieren más recursos informáticos, sino que también tienen mayores requisitos para la calidad y estabilidad de la potencia informática.
Lo que es más notable es que el consumo de potencia de cómputo de los servicios B-end no solo se refleja en la complejidad de una sola interacción, sino también en la frecuencia de las llamadas. En el lado B, la aplicación de modelos grandes tiende a ser continua y de alta frecuencia, en contraste con la consulta y el uso ocasional en el lado C. Por ejemplo, en sectores como el financiero, el sanitario y el manufacturero, los modelos de gran tamaño necesitan procesar continuamente grandes cantidades de datos para proporcionar análisis en tiempo real y apoyo a la toma de decisiones. Este tipo de demanda de computación de alta frecuencia y alta carga ejerce una enorme presión sobre la potencia de cómputo.
Es previsible que con la popularización de los grandes modelos en el lado B, su demanda de potencia de cálculo supere rápidamente a la del lado C. Este cambio puede ser sutil, pero su impacto es de gran alcance. Por un lado, el aumento de la demanda de potencia de cálculo impulsará el desarrollo de tecnologías relacionadas, como GPU más eficientes y arquitecturas informáticas más optimizadas. Por otro lado, también tendrá un impacto significativo en la asignación de recursos, la estructura de costos y el modelo de negocio de la industria en su conjunto.
En el proceso, es posible que veamos a algunas empresas obligadas a salir del mercado porque no pueden permitirse este coste de la potencia informática, o que algunas empresas se destaquen con tecnologías avanzadas de gestión y optimización de la potencia informática.
China se enfrenta a un doble cuello de botella en el poder de cómputo
A nivel mundial, la escasez de potencia informática se ha convertido en un importante cuello de botella en el desarrollo de la inteligencia artificial, y para China, este desafío es particularmente grave. Las empresas chinas de modelos a gran escala tienen que hacer frente no sólo a la escasez mundial de potencia informática («desastres naturales»), sino también a limitaciones únicas de la oferta del mercado («desastres provocados por el hombre»), lo que hace que las perspectivas de desarrollo de China en el campo de los grandes modelos sean complejas y desafiantes.
Debemos reconocer las limitaciones de las empresas modelo a gran escala de China en materia de recursos informáticos. Si bien empresas como Baidu, Alibaba, ByteDance, Tencent y Huawei han logrado logros notables en el desarrollo de grandes modelos, los desafíos informáticos a los que se enfrentan son reales y urgentes. En la actualidad, debido a la falta general de desarrollo de la industria mundial de GPU, las empresas chinas han encontrado grandes obstáculos para obtener suficientes recursos informáticos. Este tipo de problema de "desastre natural" es la única forma de desarrollo tecnológico y actualización industrial, y se necesita tiempo y una gran inversión para resolverlo.
Lo que es más complicado es que las empresas de modelos a gran escala de China también se enfrentan a "desastres provocados por el hombre" del mercado internacional, especialmente las limitaciones de suministro de gigantes internacionales como Nvidia al mercado chino. Esta restricción política ha afectado directamente a la capacidad de las empresas chinas para obtener chips de GPU de gama alta, lo que ha agravado la escasez de recursos informáticos. No cabe duda de que esta doble restricción ha añadido incertidumbres y desafíos adicionales al desarrollo de las empresas modelo a gran escala de China.
En la actualidad, aunque el número de usuarios de productos como Wenxin Yiyan de Baidu y Tongyi Qianwen de Alibaba no ha alcanzado la escala de los 100 millones de ChatGPT, esto no significa que las empresas chinas puedan hacer frente fácilmente a los desafíos informáticos existentes. Con el desarrollo de estos productos y la expansión del mercado, especialmente cuando comienzan a ser ampliamente utilizados en el mercado de gama B, la demanda de potencia informática aumentará drásticamente. En este momento, el problema de la escasez de potencia informática se volverá más prominente, lo que puede restringir seriamente el desarrollo de la gran industria de modelos de China.
A largo plazo, si China no puede hacer frente eficazmente a este doble cuello de botella informático, entonces el desarrollo de su gran industria de modelos puede limitarse a un nivel bajo. Esto no solo afectará la competitividad del mercado interno, sino que también limitará la influencia de China en el campo de la inteligencia artificial a escala global. Por lo tanto, resolver el problema de la escasez de potencia informática es crucial para el desarrollo futuro de la gran industria de modelos de China, que no es solo una cuestión técnica, sino también una cuestión estratégica, que está relacionada con la posición y el futuro de China en la competencia mundial de IA.
En medio de los desafíos informáticos duales a los que se enfrenta China, recientemente ha habido algunas señales positivas alentadoras, especialmente en el desarrollo de GPU nacionales. Las principales empresas nacionales de tecnología, como Baidu, Alibaba, 360, etc., han comenzado a cooperar con fabricantes nacionales de GPU como Huawei.
El aumento de las GPU domésticas tiene una importancia de gran alcance para resolver el problema de la escasez de potencia informática en China. Si estas GPU domésticas pueden ser comparables al líder de la industria, NVIDIA, en términos de rendimiento, y el cuello de botella a nivel de fabricación se resuelve de manera efectiva, esto brindará oportunidades sin precedentes a la gran industria de modelos de China. Históricamente, una vez que una tecnología nacional madura, generalmente puede ingresar al mercado a un precio más competitivo. Esto significa que si las GPU nacionales pueden tener éxito, es probable que ofrezcan un rendimiento similar o incluso mejor a un precio mucho más bajo que las marcas internacionales.
Esta ventaja de costos no solo aliviará la actual escasez de potencia informática, sino que también tiene el potencial de revolucionar el panorama del mercado. En la actualidad, el alto precio de las GPU ha sido un factor importante que limita la popularidad y la aplicación de la tecnología de modelos grandes. Si las GPU domésticas pueden proporcionar potencia informática de alto rendimiento a un precio más bajo, esto promoverá en gran medida la aplicación de la tecnología de modelos grandes en todos los ámbitos de la vida y acelerará el desarrollo de China en el campo de la inteligencia artificial.
Y lo que es más importante, este desarrollo podría permitir a China "convertir la derrota en victoria" en la carrera mundial de la IA. En términos de potencia y aplicaciones de computación de modelos a gran escala, China no solo puede ponerse al día, sino incluso superar a países líderes como Estados Unidos.
Por supuesto, todo esto aún está en el comienzo del desarrollo, y el éxito de las GPU domésticas aún debe superar los desafíos técnicos. Sin embargo, ha habido señales positivas de que China ha dado pasos sólidos en el camino hacia la autonomía informática. En los próximos años, se espera que seamos testigos de la madurez y la aplicación a gran escala de la tecnología de GPU nacional, y cómo promoverá el rápido desarrollo de la gran industria de modelos de China.
En resumen, en el viaje de exploración del desafío global de la escasez de potencia informática, no solo hemos sido testigos del avance continuo de los límites tecnológicos, sino que también hemos experimentado profundamente los complejos desafíos que enfrenta el desarrollo de la industria. Desde la historia de OpenAI hasta el doble dilema de las empresas de modelos a gran escala de China, pasando por el auge de la tecnología de GPU doméstica, todo esto revela una verdad fundamental: la potencia informática se ha convertido en un recurso estratégico clave en el futuro camino de desarrollo de la inteligencia artificial. No se trata solo de una competencia a nivel técnico, sino también de una inversión y un diseño de fuerzas científicas y tecnológicas globales para el futuro.
De cara al futuro, con los avances tecnológicos y la evolución de las demandas del mercado, tenemos razones para creer que el problema de la escasez de potencia informática acabará resolviéndose. En este proceso, la innovación, la cooperación y el ajuste estratégico serán los temas clave que todo participante deberá afrontar. En última instancia, este desafío de la potencia informática definirá el futuro de la tecnología de IA y dará forma a nuestro mundo digital.