Em 17 de outubro, os Estados Unidos reforçaram a proibição de chips de IA para o mercado chinês. Entre eles, desempenho e densidade são claramente considerados como padrões de controle de exportação, e chips com um poder de computação de mais de 300 teraflops por chip e uma densidade de desempenho de mais de 370 gigaflops por milímetro quadrado estão incluídos na lista de exportações proibidas.
Embora sob esta proibição, os chips de IA high-end fornecidos pela AMD, Intel e outras empresas também são afetados. No entanto, devido ao domínio da Nvidia no campo global de chips de IA, essa proibição envolve o treinamento de IA convencional de GPUs NVIDIA, como A100 e H100, então essa proibição de chips também é conhecida como "proibição da NVIDIA".
Assim que a notícia saiu, imediatamente despertou discussões acaloradas na indústria de IA. No entanto, a maior parte da discussão se concentrou em quando a proibição será implementada, se há uma zona de buffer, quais modelos de GPU estão envolvidos e quanto tempo a proibição durará. Isso leva a um contexto macro óbvio que tem sido negligenciado: embora a relação econômica e comercial entre a China e os Estados Unidos tenha flutuado de tempos em tempos desde o início do atrito comercial, o controle de chips para a China sempre aumentou ininterruptamente. Em particular, a proibição de chips de IA high-end foi firmemente implementada em muitas controvérsias.
Neste ponto, parece que a indústria de IA tem que formar um consenso básico: abandonar as ilusões e se preparar para a luta.
Em vez de se preocupar com quais GPUs são proibidas, se é possível levantar a proibição. Por que você não reexamina para onde a computação de IA da China está indo na era da Cortina de Ferro dos chips?
Neste artigo, esperamos partir da situação atual da indústria e pensar sobre o caminho a seguir para a computação de IA.
Situação Atual
Em primeiro lugar, devemos entender uma questão, ou seja, por que após a introdução da proibição da NVIDIA, a reação da opinião pública e da indústria de IA não foi tão séria quanto no início do bloqueio de chips em 18 ou 19. Parece que apenas a questão de saber se a placa gráfica RTX 4090 é proibida provocou algum debate entre os jogadores e comerciantes relacionados.
A lógica macro por trás disso é que a indústria está muito relutante em ver chips de IA high-end proibidos, mas, na verdade, essa situação já era esperada há muito tempo. Por um lado, os Estados Unidos promoveram o bloqueio de chips na China por muitos anos, e algumas das GPUs high-end da Nvidia foram proibidas, e o feedback da indústria tem sido ajustado de choque para calma. Além disso, após a explosão do ChatGPT, o mercado global de GPUs high-end aumentou acentuadamente este ano, seguido pelas repetidas declarações dos Estados Unidos para promover a proibição geral da venda de chips de IA high-end para a China. Depois de alguns meses, não é diferente para finalmente bater um martelo.
Para fazer face a esta previsível proibição, e ao mesmo tempo há uma promoção objetiva do desenvolvimento de grandes modelos, desde o final do ano passado até ao primeiro semestre deste ano, um grande número de empresas chinesas nas áreas da ciência e tecnologia, finanças e automóveis concentraram-se em armazenar GPUs topo de gama da Nvidia, o que causou uma situação em que é difícil encontrar uma placa no mercado. Em outras palavras, para muitas pequenas e médias empresas chinesas de tecnologia e startups de IA, GPUs high-end não podem ser compradas, e pouca coisa mudou desde a proibição.
Outra realidade é que os chips de IA high-end não são impossíveis de localizar. Já 18 e 19 anos após o início dos atritos comerciais, a indústria doméstica de chips de IA acelerou seu desenvolvimento. Isso leva ao fato de que, em termos de necessidades de treinamento de IA, embora as GPUs high-end da NVIDIA sejam difíceis de substituir, elas não são insubstituíveis.
Além disso, os chips de IA não são tão relevantes para os consumidores de massa quanto os chips de celular, e a Huawei fez um avanço nos chips de celular. Todos os tipos de sinais se combinaram para fazer com que tanto o público quanto a indústria tivessem uma mentalidade calma, até um pouco estranha, sobre essa proibição.
Mas é preciso ver objetivamente que essa proibição não é, de forma alguma, inofensiva para a indústria de IA da China. Por um lado, é muito difícil substituir as GPUs NVIDIA a curto prazo, tanto em termos de capacidade de produção de chips como de compatibilidade ecológica. E a proibição também causará danos diretos aos fabricantes que usam produtos NVIDIA em larga escala em áreas como servidores de IA.
A questão mais crítica é que, no futuro, se a proibição persistir por um longo tempo, a computação de IA da China se desacoplará gradualmente dos chips high-end do mundo, e os possíveis efeitos negativos de longo prazo são muito complexos, tais como:
Os chips de IA representados pelas GPUs high-end da NVIDIA causarão uma desconexão no desenvolvimento do poder de computação de IA da China depois de serem atualizados e iterados?
Após o desenvolvimento da divergência subjacente ao poder de computação, a indústria de IA da China ficará para trás no desenvolvimento de tecnologias de software, como modelos de grande porte?
Esta proibição de chips de IA mostrou as características dos bloqueios em grande escala. Será que este bloqueio tecnológico realmente só vai ficar no campo dos chips de IA? As capacidades digitais básicas, como o poder de computação geral, o armazenamento e o software básico, tornar-se-ão os próximos alvos?
Em suma, a proibição de chips de IA é um jogo preparado para a China, não um ataque surpresa. Se você quiser passar com sucesso por este nível, você também precisa jogar todas as cartas em sua mão bem e jogá-lo juntos, de modo a reduzir a intensidade do dano e aumentar a taxa de vitória a longo prazo.
Atualmente, a computação de IA da China tem três "planos inovadores" que devem ser trabalhados ao mesmo tempo.
Opção 1: Faça bom uso da identidade do "comprador"
Há uma verdade simples, a lógica do comportamento do mercado comercial é determinada pela oferta e pela procura. No entanto, no comércio de tecnologia entre a China e os Estados Unidos, representado por chips, muitas vezes caímos em um erro de pensamento: pensamos que a maioria das regras do jogo são definidas pelo governo e empresas dos EUA, e eles querem nos vender, nós vamos comprar, e eles não vão querer nos comprar.
Como maior "comprador" do mercado global de chips, as empresas chinesas não têm o direito de falar, o que é muito absurdo.
Na verdade, a proibição de chips de IA no mercado chinês prejudicou diretamente as gigantes tecnológicas americanas representadas pela Nvidia. Atualmente, a maior demanda do mercado por chips de IA da NVIDIA vem da China. Anteriormente, o CEO da Nvidia, Jensen Huang, deixou claro que "se formos privados do mercado chinês, não temos medidas de emergência e não há outra China no mundo".
Neste contexto, podemos ver uma forte contradição entre as empresas de tecnologia americanas, que perseguem interesses comerciais, e o governo dos EUA, que persegue interesses políticos. Empresas de tecnologia dos EUA estão sempre procurando maneiras de se opor e contornar a proibição, como a Nvidia, que lançou uma versão específica da GPU para a China em resposta ao embargo no ano passado.
O mercado chinês digere cerca de um terço da capacidade de produção das empresas de tecnologia dos EUA, e o vínculo de oferta e demanda entre os dois não pode ser cortado por muito tempo. Diante da proibição global de tecnologia cada vez mais óbvia nos Estados Unidos, o mercado chinês também deve fazer uso ativo de seu status de "comprador" para tornar seu próprio comportamento mais distinto e previsível.
Evite criar uma espécie de desempenho e impressão de "bem-vindo se vender, só desamparado se não vender".
A "identidade do comprador" deve ser aquela que tem uma posição, poder e raiva.
Esquema 2: Substitua a placa pela nuvem e o poder de computação está concentrado
Por um longo período de tempo, a proibição dos EUA aos chips de IA da China só pode ser reforçada, e esse momento coincide com o estágio crítico do desenvolvimento de grandes modelos de IA. Muitas pessoas na indústria acreditam que, embora o desenvolvimento de grandes modelos seja rápido, ele não mostrou a situação rápida de outros veículos científicos e tecnológicos antes, e a falta de dinheiro para investimento e a falta de cartões para computação são as principais razões.
Então, como resolver o problema da lacuna de poder de computação na indústria de IA da China sob a proibição? O primeiro plano de contingência é que as empresas aumentem a alocação e o investimento do poder de computação em nuvem e promovam o uso da nuvem para substituir os cartões.
Na verdade, sob a tendência geral de que os chips de IA high-end podem ser proibidos, vários grandes fabricantes de nuvem pública na China fizeram movimentos para aumentar seu açambarcamento de GPUs high-end da Nvidia. Por um lado, isso ocorre porque os próprios fornecedores de nuvem precisam aumentar o investimento em grandes modelos e abrir o mercado de MaaS, então há uma demanda direta por poder de computação de IA. Por outro lado, também é porque as GPUs podem ser reutilizadas por um longo tempo depois de serem convertidas em pools de recursos de nuvem, que é uma situação em que os fornecedores de nuvem podem atacar e recuar. Portanto, no primeiro semestre deste ano, houve uma situação em que todos os chips de IA high-end no mercado fluíram para fabricantes de nuvem, e foi difícil para as pequenas e médias empresas encontrar um cartão.
De um ponto de vista objetivo, esta mudança de chips de IA high-end para a nuvem é benéfica para todo o mercado chinês para lidar com a proibição de chips de IA, e também está em linha com o pensamento estratégico da Eastern Data e Western Computing.
Outra tendência que é boa para o poder de computação em nuvem da IA é o número crescente de grandes parâmetros do modelo e a quantidade de dados usados. O treinamento de pool de cartões localizado tem se tornado cada vez mais apertado. O treinamento de quilocalorias e 10.000 calorias que deve ocorrer na nuvem tornou-se a principal direção de desenvolvimento no futuro, de modo que os usuários corporativos serão naturalmente mais ativos na nuvem.
Ao mesmo tempo, o poder de computação em nuvem da IA não ficará apenas no nível de acumular GPUs NVIDIA. Em seguida, é a tendência geral para o poder de computação de IA independente doméstico para dirigir para a nuvem. Impulsionados por políticas relevantes, os fornecedores de nuvem estão aumentando a aquisição de chips de IA independentes. De acordo com dados da IDC, no primeiro semestre de 2023, 500.000 chips aceleradores de IA autodesenvolvidos foram usados nos servidores de IA da China. Em termos de servitização do poder de computação de IA autônoma, a HUAWEI CLOUD lançou o serviço de nuvem Ascend AI. O poder de computação da IA, que combina nuvem e autonomia, será muito desenvolvido no contexto da proibição dos chips de IA.
Além disso, nos últimos anos, um grande número de centros de computação de IA usando poder de computação de IA independente foram estabelecidos em vários lugares no contexto de dados orientais e computação ocidental e, no geral, o poder de computação de IA em nuvem da China é estável e confiável.
No entanto, muitas empresas ainda preferem comprar poder de computação de IA local. Por um lado, isso ocorre porque o mercado de GPUs NVIDIA está em falta, e a retenção de valor é particularmente boa, e pode até ser usada como o principal ativo da empresa. Por outro lado, o poder de computação da IA em nuvem geralmente tem problemas como filas, tempo de inatividade e falta de serviços de software.
Como melhorar ainda mais a experiência dos desenvolvedores que usam o poder de computação de IA em nuvem é a próxima direção na qual os fornecedores de nuvem pública precisam se concentrar.
Solução 3: Deixe o poder de computação de IA doméstico crescer explosivamente
Diante de uma nova rodada de proibição de chips de IA, qual é a maior confiança da indústria de IA da China? É um hábito depois de muitos anos, ou há um excedente de comida em casa depois de um grande número de tunka? Nenhum dos dois. O nó mais crítico é que, após anos de desenvolvimento, a indústria de chips de IA da China se desenvolveu tremendamente. As GPUs high-end da Nvidia ainda são importantes, mas não é como se não houvesse alternativa.
De acordo com dados divulgados anteriormente pela IDC, as remessas de cartões aceleradores de IA da China em 2022 serão de cerca de 1,09 milhão, dos quais a participação de mercado da Nvidia chegará a 85%, a participação de mercado da Huawei Ascend Reality chegará a 10%, a Baidu Kunlun será de 2% e a Cambrian e Suiyuan Technology será de 1%.
Pode-se ver que o poder de computação da IA doméstica alcançou um certo grau de participação de mercado, não apenas "no papel" em conceitos e teorias. Ao mesmo tempo, também deve ser notado que os chips de IA domésticos ainda não são ideais em termos de desempenho central, ecologia de software e capacidade de envio, e ainda há um longo caminho a percorrer. Sob as condições objetivas da proibição da NVIDIA, o poder de computação de IA doméstico deve superar essas dificuldades no curto prazo e acelerar seu próprio ciclo de crescimento e maturidade.
Para alcançar este objetivo, várias coisas são muito importantes:
**1. Formar um consenso da indústria para evitar confusão de conceitos. **
Quando se trata de chips de IA, costumamos dizer que tem muitas maneiras de implementá-lo, e há muitas marcas independentes participando desse mercado, que parece ser próspero. Por exemplo, os chips de IA incluem GPU, FPGA, ASIC, integração de armazenamento e computação e chips semelhantes ao cérebro, etc., e os fabricantes domésticos de chips de aceleração de IA incluem Alibaba, Baidu, Huawei, Cambrian, Haiguang Information, Suiyuan Technology, Tiantian Zhixin, Biqian Technology, Moore Threads, Loongson Zhongke, etc.
Este tipo de "prosperidade" não só é confuso na opinião pública e no mercado de investimento, como também aparece frequentemente em alguns relatórios da indústria e análises políticas. Mas o problema é que a definição de chips de IA é geralmente exagerada. Por exemplo, chips semelhantes ao cérebro são apenas imaginações técnicas no futuro previsível, e se chips semelhantes ao cérebro forem adicionados toda vez que chips de IA domésticos forem discutidos, isso só perderá tempo e distrairá energia. Por outro exemplo, alguns fabricantes de chips de IA só podem fabricar chips para uso próprio e não podem enviá-los para o mercado. Alguns fornecedores ainda não têm a capacidade de comercializar e estão no estágio inicial de construção, e sua contribuição para a autonomia de computação de IA no curto prazo é muito pequena.
Para lidar com a proibição das GPUs high-end da Nvidia, precisamos nos concentrar em alternativas de GPU viáveis e eficazes, em vez de fazer muitas associações e divergências. Só formando este consenso industrial poderemos reunir forças para resolver o problema. **
**2. Avançar para uma utilização comercial em larga escala e evitar a criação de núcleos de PPT. **
Na verdade, não importa da perspetiva de chips de aceleração de IA ou máquinas de servidor, há muito poucos fabricantes de chips de IA que podem enviar na China. Concentradas principalmente na Huawei e Baidu, Suiyuan Technology e Haiguang Information também têm certas remessas. Um grande número de fabricantes de semicondutores e empresas de IA ainda estão presos no plano e na visão de construir chips. Isso levou à estagnação de um grande número de chips de IA domésticos que foram apoiados por políticas e expectativas do mercado de investimentos, e há até uma suspeita de permanecer nesta fase para desfrutar dos dividendos do mercado financeiro.
**A próxima orientação da indústria deve passar do estabelecimento de chips de IA para a remessa de chips de IA, ajudar os fabricantes de chips de IA a obter feedback comercial direto, aceitar testes de mercado de produtos e capacidade de produção e moldar gradualmente o fluxo de caixa positivo. **
Fortalecer o ecossistema de software e fortalecer as capacidades de migração. **
A razão pela qual a GPU NVIDIA é importante não é apenas no desempenho de hardware, mas também nas capacidades ecológicas de software com CUDA e PyTorch como o núcleo, então o desenvolvimento de chips de IA domésticos não deve subestimar a capacidade do software. Ao mesmo tempo em que fortalece a construção do ecossistema de software independente, também é necessário prestar atenção à capacidade de migração e ao custo de migração da construção de modelos de IA baseados no ecossistema NVIDIA.
Para este fim, um grande número de fabricantes têm explorado, como o DCU de Haiguang Information, que é altamente semelhante ao CUDA em termos de ecologia e ambiente de programação, e os usuários CUDA podem migrar rapidamente para a plataforma ROCm do Haiguang a um baixo custo. Anteriormente, o PyTorch 2.1 anunciou suporte para o Ascend da Huawei. Pode-se ver que os chips de IA domésticos têm uma certa influência de escala e podem ser mais integrados ao ecossistema global de software.
**No futuro, se você quiser perceber a explosão da computação de IA doméstica, você não pode deixar o surto da ecologia de software básico de IA doméstica. **
Aumentar o apoio à "marca principal" e formar um efeito em larga escala. **
Para os chips de IA americanos, além das GPUs NVIDIA, o que mais você sabe? Mesmo que essa pergunta seja feita a alguns desenvolvedores de IA, a resposta é em grande parte pouco clara ou não tentada. Pode-se ver que a computação de IA, assim como a computação geral e a computação gráfica, tem uma alta probabilidade de que uma ou duas "marcas principais" acabem aparecendo. Isso pertence à lei objetiva do mercado, e não há necessidade de alcançar uma situação de "deixar uma centena de flores florescer" na forma de puxar mudas para ajudá-las a crescer.
Mesmo na medida em que a computação de IA da China deve acelerar sua maturidade e completar o objetivo de substituição autônoma, é uma coisa boa para alcançar uma situação de um super e muitos fortes o mais rápido possível. Isso pode evitar a fragmentação ecológica e o desperdício de uma grande quantidade de investimento em TI causado pela oscilação da indústria. Este processo deve ser deixado à escolha do mercado, tomando forma lentamente. No entanto, no contexto da proibição de chips, a ascensão da computação de IA doméstica chegou ao fim, em vez de deixar 100 tipos de chips de IA amadurecerem lentamente e embaralharem lentamente, como acelerar a formação de uma situação de rápida substituição de "marcas principais".
A julgar pela situação atual, a Ascend é a força mais provável para se tornar a principal marca de poder de computação de IA doméstica. Liu Qingfeng, fundador e presidente da iFLYTEK, disse anteriormente que a GPU da Huawei foi comparada com a NVIDIA A100. De acordo com os dados, o poder de computação de precisão inteiro Ascend 310 atinge 16 TOPS, e o poder de computação de precisão inteiro Ascend 910 atinge 640 TOPS. Isso significa que o desempenho do Ascend 910 é próximo ao do NVIDIA A100.
Ao mesmo tempo, a Ascend é atualmente o único poder de computação de IA doméstico que tem uma participação de mercado estável, e incubou uma arquitetura de computação heterogênea CANN semelhante à NVIDIA CUDA e uma estrutura de computação de IA MindSpore em software. Em termos de desempenho central, ecossistema de software e participação de mercado, a Ascend tem a viabilidade de acelerar o crescimento e realizar a localização em larga escala do poder de computação da IA.
**Padronizar os padrões da indústria, fortalecer a construção de software e melhorar o suporte de marcas independentes são as principais maneiras de promover o rápido crescimento do poder de computação de IA doméstico no curto prazo. **
A proibição da Nvidia é um problema que a indústria chinesa de IA geralmente não quer ver, tentar evitar, e até hoje é um pouco secreta. No entanto, a situação é mais forte do que as pessoas, e no processo acelerado de desglobalização e na corrida da IA, há uma alta probabilidade de que proibições semelhantes só serão muito mais prováveis no futuro.
A evasão, o desvio e o silêncio não podem resolver o problema, e só lidando calmamente com ele e lutando pelo autoaperfeiçoamento podemos resolver fundamentalmente o problema de sermos controlados pelos outros.
Sob a proibição, para onde vai a computação de IA da China a partir daqui?
A resposta é que não temos escolha, por isso temos de dar ao mundo uma segunda escolha.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Após a proibição da NVIDIA, para onde vai a computação de IA da China?
Fonte original: Cérebro corpo polar
Em 17 de outubro, os Estados Unidos reforçaram a proibição de chips de IA para o mercado chinês. Entre eles, desempenho e densidade são claramente considerados como padrões de controle de exportação, e chips com um poder de computação de mais de 300 teraflops por chip e uma densidade de desempenho de mais de 370 gigaflops por milímetro quadrado estão incluídos na lista de exportações proibidas.
Embora sob esta proibição, os chips de IA high-end fornecidos pela AMD, Intel e outras empresas também são afetados. No entanto, devido ao domínio da Nvidia no campo global de chips de IA, essa proibição envolve o treinamento de IA convencional de GPUs NVIDIA, como A100 e H100, então essa proibição de chips também é conhecida como "proibição da NVIDIA".
Assim que a notícia saiu, imediatamente despertou discussões acaloradas na indústria de IA. No entanto, a maior parte da discussão se concentrou em quando a proibição será implementada, se há uma zona de buffer, quais modelos de GPU estão envolvidos e quanto tempo a proibição durará. Isso leva a um contexto macro óbvio que tem sido negligenciado: embora a relação econômica e comercial entre a China e os Estados Unidos tenha flutuado de tempos em tempos desde o início do atrito comercial, o controle de chips para a China sempre aumentou ininterruptamente. Em particular, a proibição de chips de IA high-end foi firmemente implementada em muitas controvérsias.
Neste ponto, parece que a indústria de IA tem que formar um consenso básico: abandonar as ilusões e se preparar para a luta.
Em vez de se preocupar com quais GPUs são proibidas, se é possível levantar a proibição. Por que você não reexamina para onde a computação de IA da China está indo na era da Cortina de Ferro dos chips?
Neste artigo, esperamos partir da situação atual da indústria e pensar sobre o caminho a seguir para a computação de IA.
Situação Atual
Em primeiro lugar, devemos entender uma questão, ou seja, por que após a introdução da proibição da NVIDIA, a reação da opinião pública e da indústria de IA não foi tão séria quanto no início do bloqueio de chips em 18 ou 19. Parece que apenas a questão de saber se a placa gráfica RTX 4090 é proibida provocou algum debate entre os jogadores e comerciantes relacionados.
A lógica macro por trás disso é que a indústria está muito relutante em ver chips de IA high-end proibidos, mas, na verdade, essa situação já era esperada há muito tempo. Por um lado, os Estados Unidos promoveram o bloqueio de chips na China por muitos anos, e algumas das GPUs high-end da Nvidia foram proibidas, e o feedback da indústria tem sido ajustado de choque para calma. Além disso, após a explosão do ChatGPT, o mercado global de GPUs high-end aumentou acentuadamente este ano, seguido pelas repetidas declarações dos Estados Unidos para promover a proibição geral da venda de chips de IA high-end para a China. Depois de alguns meses, não é diferente para finalmente bater um martelo.
Para fazer face a esta previsível proibição, e ao mesmo tempo há uma promoção objetiva do desenvolvimento de grandes modelos, desde o final do ano passado até ao primeiro semestre deste ano, um grande número de empresas chinesas nas áreas da ciência e tecnologia, finanças e automóveis concentraram-se em armazenar GPUs topo de gama da Nvidia, o que causou uma situação em que é difícil encontrar uma placa no mercado. Em outras palavras, para muitas pequenas e médias empresas chinesas de tecnologia e startups de IA, GPUs high-end não podem ser compradas, e pouca coisa mudou desde a proibição.
Outra realidade é que os chips de IA high-end não são impossíveis de localizar. Já 18 e 19 anos após o início dos atritos comerciais, a indústria doméstica de chips de IA acelerou seu desenvolvimento. Isso leva ao fato de que, em termos de necessidades de treinamento de IA, embora as GPUs high-end da NVIDIA sejam difíceis de substituir, elas não são insubstituíveis.
Além disso, os chips de IA não são tão relevantes para os consumidores de massa quanto os chips de celular, e a Huawei fez um avanço nos chips de celular. Todos os tipos de sinais se combinaram para fazer com que tanto o público quanto a indústria tivessem uma mentalidade calma, até um pouco estranha, sobre essa proibição.
Mas é preciso ver objetivamente que essa proibição não é, de forma alguma, inofensiva para a indústria de IA da China. Por um lado, é muito difícil substituir as GPUs NVIDIA a curto prazo, tanto em termos de capacidade de produção de chips como de compatibilidade ecológica. E a proibição também causará danos diretos aos fabricantes que usam produtos NVIDIA em larga escala em áreas como servidores de IA.
A questão mais crítica é que, no futuro, se a proibição persistir por um longo tempo, a computação de IA da China se desacoplará gradualmente dos chips high-end do mundo, e os possíveis efeitos negativos de longo prazo são muito complexos, tais como:
Os chips de IA representados pelas GPUs high-end da NVIDIA causarão uma desconexão no desenvolvimento do poder de computação de IA da China depois de serem atualizados e iterados?
Após o desenvolvimento da divergência subjacente ao poder de computação, a indústria de IA da China ficará para trás no desenvolvimento de tecnologias de software, como modelos de grande porte?
Esta proibição de chips de IA mostrou as características dos bloqueios em grande escala. Será que este bloqueio tecnológico realmente só vai ficar no campo dos chips de IA? As capacidades digitais básicas, como o poder de computação geral, o armazenamento e o software básico, tornar-se-ão os próximos alvos?
Em suma, a proibição de chips de IA é um jogo preparado para a China, não um ataque surpresa. Se você quiser passar com sucesso por este nível, você também precisa jogar todas as cartas em sua mão bem e jogá-lo juntos, de modo a reduzir a intensidade do dano e aumentar a taxa de vitória a longo prazo.
Atualmente, a computação de IA da China tem três "planos inovadores" que devem ser trabalhados ao mesmo tempo.
Opção 1: Faça bom uso da identidade do "comprador"
Há uma verdade simples, a lógica do comportamento do mercado comercial é determinada pela oferta e pela procura. No entanto, no comércio de tecnologia entre a China e os Estados Unidos, representado por chips, muitas vezes caímos em um erro de pensamento: pensamos que a maioria das regras do jogo são definidas pelo governo e empresas dos EUA, e eles querem nos vender, nós vamos comprar, e eles não vão querer nos comprar.
Como maior "comprador" do mercado global de chips, as empresas chinesas não têm o direito de falar, o que é muito absurdo.
Na verdade, a proibição de chips de IA no mercado chinês prejudicou diretamente as gigantes tecnológicas americanas representadas pela Nvidia. Atualmente, a maior demanda do mercado por chips de IA da NVIDIA vem da China. Anteriormente, o CEO da Nvidia, Jensen Huang, deixou claro que "se formos privados do mercado chinês, não temos medidas de emergência e não há outra China no mundo".
Neste contexto, podemos ver uma forte contradição entre as empresas de tecnologia americanas, que perseguem interesses comerciais, e o governo dos EUA, que persegue interesses políticos. Empresas de tecnologia dos EUA estão sempre procurando maneiras de se opor e contornar a proibição, como a Nvidia, que lançou uma versão específica da GPU para a China em resposta ao embargo no ano passado.
O mercado chinês digere cerca de um terço da capacidade de produção das empresas de tecnologia dos EUA, e o vínculo de oferta e demanda entre os dois não pode ser cortado por muito tempo. Diante da proibição global de tecnologia cada vez mais óbvia nos Estados Unidos, o mercado chinês também deve fazer uso ativo de seu status de "comprador" para tornar seu próprio comportamento mais distinto e previsível.
Evite criar uma espécie de desempenho e impressão de "bem-vindo se vender, só desamparado se não vender".
A "identidade do comprador" deve ser aquela que tem uma posição, poder e raiva.
Esquema 2: Substitua a placa pela nuvem e o poder de computação está concentrado
Por um longo período de tempo, a proibição dos EUA aos chips de IA da China só pode ser reforçada, e esse momento coincide com o estágio crítico do desenvolvimento de grandes modelos de IA. Muitas pessoas na indústria acreditam que, embora o desenvolvimento de grandes modelos seja rápido, ele não mostrou a situação rápida de outros veículos científicos e tecnológicos antes, e a falta de dinheiro para investimento e a falta de cartões para computação são as principais razões.
Então, como resolver o problema da lacuna de poder de computação na indústria de IA da China sob a proibição? O primeiro plano de contingência é que as empresas aumentem a alocação e o investimento do poder de computação em nuvem e promovam o uso da nuvem para substituir os cartões.
Na verdade, sob a tendência geral de que os chips de IA high-end podem ser proibidos, vários grandes fabricantes de nuvem pública na China fizeram movimentos para aumentar seu açambarcamento de GPUs high-end da Nvidia. Por um lado, isso ocorre porque os próprios fornecedores de nuvem precisam aumentar o investimento em grandes modelos e abrir o mercado de MaaS, então há uma demanda direta por poder de computação de IA. Por outro lado, também é porque as GPUs podem ser reutilizadas por um longo tempo depois de serem convertidas em pools de recursos de nuvem, que é uma situação em que os fornecedores de nuvem podem atacar e recuar. Portanto, no primeiro semestre deste ano, houve uma situação em que todos os chips de IA high-end no mercado fluíram para fabricantes de nuvem, e foi difícil para as pequenas e médias empresas encontrar um cartão.
De um ponto de vista objetivo, esta mudança de chips de IA high-end para a nuvem é benéfica para todo o mercado chinês para lidar com a proibição de chips de IA, e também está em linha com o pensamento estratégico da Eastern Data e Western Computing.
Outra tendência que é boa para o poder de computação em nuvem da IA é o número crescente de grandes parâmetros do modelo e a quantidade de dados usados. O treinamento de pool de cartões localizado tem se tornado cada vez mais apertado. O treinamento de quilocalorias e 10.000 calorias que deve ocorrer na nuvem tornou-se a principal direção de desenvolvimento no futuro, de modo que os usuários corporativos serão naturalmente mais ativos na nuvem.
Ao mesmo tempo, o poder de computação em nuvem da IA não ficará apenas no nível de acumular GPUs NVIDIA. Em seguida, é a tendência geral para o poder de computação de IA independente doméstico para dirigir para a nuvem. Impulsionados por políticas relevantes, os fornecedores de nuvem estão aumentando a aquisição de chips de IA independentes. De acordo com dados da IDC, no primeiro semestre de 2023, 500.000 chips aceleradores de IA autodesenvolvidos foram usados nos servidores de IA da China. Em termos de servitização do poder de computação de IA autônoma, a HUAWEI CLOUD lançou o serviço de nuvem Ascend AI. O poder de computação da IA, que combina nuvem e autonomia, será muito desenvolvido no contexto da proibição dos chips de IA.
Além disso, nos últimos anos, um grande número de centros de computação de IA usando poder de computação de IA independente foram estabelecidos em vários lugares no contexto de dados orientais e computação ocidental e, no geral, o poder de computação de IA em nuvem da China é estável e confiável.
No entanto, muitas empresas ainda preferem comprar poder de computação de IA local. Por um lado, isso ocorre porque o mercado de GPUs NVIDIA está em falta, e a retenção de valor é particularmente boa, e pode até ser usada como o principal ativo da empresa. Por outro lado, o poder de computação da IA em nuvem geralmente tem problemas como filas, tempo de inatividade e falta de serviços de software.
Como melhorar ainda mais a experiência dos desenvolvedores que usam o poder de computação de IA em nuvem é a próxima direção na qual os fornecedores de nuvem pública precisam se concentrar.
Solução 3: Deixe o poder de computação de IA doméstico crescer explosivamente
Diante de uma nova rodada de proibição de chips de IA, qual é a maior confiança da indústria de IA da China? É um hábito depois de muitos anos, ou há um excedente de comida em casa depois de um grande número de tunka? Nenhum dos dois. O nó mais crítico é que, após anos de desenvolvimento, a indústria de chips de IA da China se desenvolveu tremendamente. As GPUs high-end da Nvidia ainda são importantes, mas não é como se não houvesse alternativa.
De acordo com dados divulgados anteriormente pela IDC, as remessas de cartões aceleradores de IA da China em 2022 serão de cerca de 1,09 milhão, dos quais a participação de mercado da Nvidia chegará a 85%, a participação de mercado da Huawei Ascend Reality chegará a 10%, a Baidu Kunlun será de 2% e a Cambrian e Suiyuan Technology será de 1%.
Pode-se ver que o poder de computação da IA doméstica alcançou um certo grau de participação de mercado, não apenas "no papel" em conceitos e teorias. Ao mesmo tempo, também deve ser notado que os chips de IA domésticos ainda não são ideais em termos de desempenho central, ecologia de software e capacidade de envio, e ainda há um longo caminho a percorrer. Sob as condições objetivas da proibição da NVIDIA, o poder de computação de IA doméstico deve superar essas dificuldades no curto prazo e acelerar seu próprio ciclo de crescimento e maturidade.
Para alcançar este objetivo, várias coisas são muito importantes:
**1. Formar um consenso da indústria para evitar confusão de conceitos. **
Quando se trata de chips de IA, costumamos dizer que tem muitas maneiras de implementá-lo, e há muitas marcas independentes participando desse mercado, que parece ser próspero. Por exemplo, os chips de IA incluem GPU, FPGA, ASIC, integração de armazenamento e computação e chips semelhantes ao cérebro, etc., e os fabricantes domésticos de chips de aceleração de IA incluem Alibaba, Baidu, Huawei, Cambrian, Haiguang Information, Suiyuan Technology, Tiantian Zhixin, Biqian Technology, Moore Threads, Loongson Zhongke, etc.
Este tipo de "prosperidade" não só é confuso na opinião pública e no mercado de investimento, como também aparece frequentemente em alguns relatórios da indústria e análises políticas. Mas o problema é que a definição de chips de IA é geralmente exagerada. Por exemplo, chips semelhantes ao cérebro são apenas imaginações técnicas no futuro previsível, e se chips semelhantes ao cérebro forem adicionados toda vez que chips de IA domésticos forem discutidos, isso só perderá tempo e distrairá energia. Por outro exemplo, alguns fabricantes de chips de IA só podem fabricar chips para uso próprio e não podem enviá-los para o mercado. Alguns fornecedores ainda não têm a capacidade de comercializar e estão no estágio inicial de construção, e sua contribuição para a autonomia de computação de IA no curto prazo é muito pequena.
Para lidar com a proibição das GPUs high-end da Nvidia, precisamos nos concentrar em alternativas de GPU viáveis e eficazes, em vez de fazer muitas associações e divergências. Só formando este consenso industrial poderemos reunir forças para resolver o problema. **
**2. Avançar para uma utilização comercial em larga escala e evitar a criação de núcleos de PPT. **
Na verdade, não importa da perspetiva de chips de aceleração de IA ou máquinas de servidor, há muito poucos fabricantes de chips de IA que podem enviar na China. Concentradas principalmente na Huawei e Baidu, Suiyuan Technology e Haiguang Information também têm certas remessas. Um grande número de fabricantes de semicondutores e empresas de IA ainda estão presos no plano e na visão de construir chips. Isso levou à estagnação de um grande número de chips de IA domésticos que foram apoiados por políticas e expectativas do mercado de investimentos, e há até uma suspeita de permanecer nesta fase para desfrutar dos dividendos do mercado financeiro.
**A próxima orientação da indústria deve passar do estabelecimento de chips de IA para a remessa de chips de IA, ajudar os fabricantes de chips de IA a obter feedback comercial direto, aceitar testes de mercado de produtos e capacidade de produção e moldar gradualmente o fluxo de caixa positivo. **
A razão pela qual a GPU NVIDIA é importante não é apenas no desempenho de hardware, mas também nas capacidades ecológicas de software com CUDA e PyTorch como o núcleo, então o desenvolvimento de chips de IA domésticos não deve subestimar a capacidade do software. Ao mesmo tempo em que fortalece a construção do ecossistema de software independente, também é necessário prestar atenção à capacidade de migração e ao custo de migração da construção de modelos de IA baseados no ecossistema NVIDIA.
Para este fim, um grande número de fabricantes têm explorado, como o DCU de Haiguang Information, que é altamente semelhante ao CUDA em termos de ecologia e ambiente de programação, e os usuários CUDA podem migrar rapidamente para a plataforma ROCm do Haiguang a um baixo custo. Anteriormente, o PyTorch 2.1 anunciou suporte para o Ascend da Huawei. Pode-se ver que os chips de IA domésticos têm uma certa influência de escala e podem ser mais integrados ao ecossistema global de software.
**No futuro, se você quiser perceber a explosão da computação de IA doméstica, você não pode deixar o surto da ecologia de software básico de IA doméstica. **
Para os chips de IA americanos, além das GPUs NVIDIA, o que mais você sabe? Mesmo que essa pergunta seja feita a alguns desenvolvedores de IA, a resposta é em grande parte pouco clara ou não tentada. Pode-se ver que a computação de IA, assim como a computação geral e a computação gráfica, tem uma alta probabilidade de que uma ou duas "marcas principais" acabem aparecendo. Isso pertence à lei objetiva do mercado, e não há necessidade de alcançar uma situação de "deixar uma centena de flores florescer" na forma de puxar mudas para ajudá-las a crescer.
Mesmo na medida em que a computação de IA da China deve acelerar sua maturidade e completar o objetivo de substituição autônoma, é uma coisa boa para alcançar uma situação de um super e muitos fortes o mais rápido possível. Isso pode evitar a fragmentação ecológica e o desperdício de uma grande quantidade de investimento em TI causado pela oscilação da indústria. Este processo deve ser deixado à escolha do mercado, tomando forma lentamente. No entanto, no contexto da proibição de chips, a ascensão da computação de IA doméstica chegou ao fim, em vez de deixar 100 tipos de chips de IA amadurecerem lentamente e embaralharem lentamente, como acelerar a formação de uma situação de rápida substituição de "marcas principais".
A julgar pela situação atual, a Ascend é a força mais provável para se tornar a principal marca de poder de computação de IA doméstica. Liu Qingfeng, fundador e presidente da iFLYTEK, disse anteriormente que a GPU da Huawei foi comparada com a NVIDIA A100. De acordo com os dados, o poder de computação de precisão inteiro Ascend 310 atinge 16 TOPS, e o poder de computação de precisão inteiro Ascend 910 atinge 640 TOPS. Isso significa que o desempenho do Ascend 910 é próximo ao do NVIDIA A100.
Ao mesmo tempo, a Ascend é atualmente o único poder de computação de IA doméstico que tem uma participação de mercado estável, e incubou uma arquitetura de computação heterogênea CANN semelhante à NVIDIA CUDA e uma estrutura de computação de IA MindSpore em software. Em termos de desempenho central, ecossistema de software e participação de mercado, a Ascend tem a viabilidade de acelerar o crescimento e realizar a localização em larga escala do poder de computação da IA.
**Padronizar os padrões da indústria, fortalecer a construção de software e melhorar o suporte de marcas independentes são as principais maneiras de promover o rápido crescimento do poder de computação de IA doméstico no curto prazo. **
A proibição da Nvidia é um problema que a indústria chinesa de IA geralmente não quer ver, tentar evitar, e até hoje é um pouco secreta. No entanto, a situação é mais forte do que as pessoas, e no processo acelerado de desglobalização e na corrida da IA, há uma alta probabilidade de que proibições semelhantes só serão muito mais prováveis no futuro.
A evasão, o desvio e o silêncio não podem resolver o problema, e só lidando calmamente com ele e lutando pelo autoaperfeiçoamento podemos resolver fundamentalmente o problema de sermos controlados pelos outros.
Sob a proibição, para onde vai a computação de IA da China a partir daqui?
A resposta é que não temos escolha, por isso temos de dar ao mundo uma segunda escolha.