2026-02-27 21:35:46

A Anthropic revelou como as empresas chinesas de IA estão a roubar dados do Claude para criar os seus próprios LLM!

Antes de avançar, lembro que há alguns dias publiquei que, "No que diz respeito ao uso de API, as 5 principais empresas de IA do mundo, 4 estão sob controlo chinês. Os modelos de IA chineses que produzem resultados semelhantes ao Claude têm custos de API cerca de 8-10 vezes mais baixos. É por isso que esses modelos estão a ser tão utilizados na indústria." Mas como é que eles conseguiram essa capacidade?

Vamos tentar entender em detalhes.

DeepSeek, Moonshot AI (Kimi) e MiniMax são as empresas contra as quais a Anthropic apresentou queixa, alegando que lançaram um ataque de extração industrial contra o modelo Claude. Ou seja, copiaram exatamente as capacidades avançadas do Claude e tentaram treinar os seus próprios modelos com esses dados. Para isso, abriram cerca de 24 mil contas falsas e interagiram com Claude mais de 16 milhões de vezes. O objetivo era dominar as capacidades avançadas de raciocínio, comportamento de agentes, habilidades de codificação e uso de ferramentas do Claude.

A DeepSeek realizou cerca de 150 mil interações com campanhas de prompts para tentar descobrir a lógica interna ou raciocínio passo a passo do Claude. Além disso, usaram o Claude como sistema de classificação para julgar as saídas dos seus próprios modelos! Por outro lado, a Moonshot AI realizou cerca de 3,4 milhões de interações apenas para copiar raciocínio de agentes e uso de ferramentas. E a mais agressiva foi a MiniMax, que realizou aproximadamente 130 milhões de interações, focando principalmente em codificação e orquestração. Curiosamente, quando a Anthropic detecta e bloqueia essas atividades, eles mudam rapidamente para um novo modelo da Anthropic e continuam a extrair dados.

Todo esse trabalho foi feito de forma altamente planeada e descentralizada. Para evitar a deteção, usaram IPs rotativos, métodos de pagamento partilhados e atividades sincronizadas entre milhares de contas. Chegou ao ponto de se dizer que esta é a maior campanha de destilação de modelos de IA já documentada.

O contexto geopolítico por trás também é bastante interessante. Há alguns dias, a OpenAI enviou um memorando ao governo dos EUA alertando que os laboratórios chineses estão a tentar, indiretamente, aceder aos modelos frontais dos EUA.

Mas a questão é: o que vão fazer com todos esses dados roubados?
A resposta é que, usando os dados avançados do Claude, eles vão tornar os seus próprios modelos mais poderosos. Processar esses enormes volumes de dados para treinar IA requer centros de dados gigantes e supercomputadores, que consomem muita energia. Surpreendentemente, só em 2025, a China adicionou mais de 500 gigawatts de nova capacidade de energia, quase 10 vezes mais do que os EUA!

Ou seja, eles planejaram toda a estratégia de extrair dados dos modelos americanos e usar essa infraestrutura de IA para operar em escala industrial. Até agora, nenhuma das três empresas chinesas acusadas de roubo de dados negou publicamente as alegações.

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

1 gostos