A Anthropic revelou como as empresas chinesas de IA estão a roubar dados do Claude para criar os seus próprios LLM!



Antes de avançar, lembro que há alguns dias publiquei que, "No que diz respeito ao uso de API, as 5 principais empresas de IA do mundo, 4 estão sob controlo chinês. Os modelos de IA chineses que produzem resultados semelhantes ao Claude têm custos de API cerca de 8-10 vezes mais baixos. É por isso que esses modelos estão a ser tão utilizados na indústria." Mas como é que eles conseguiram essa capacidade?

Vamos tentar entender em detalhes.

DeepSeek, Moonshot AI (Kimi) e MiniMax são as empresas contra as quais a Anthropic apresentou queixa, alegando que lançaram um ataque de extração industrial contra o modelo Claude. Ou seja, copiaram exatamente as capacidades avançadas do Claude e tentaram treinar os seus próprios modelos com esses dados. Para isso, abriram cerca de 24 mil contas falsas e interagiram com Claude mais de 16 milhões de vezes. O objetivo era dominar as capacidades avançadas de raciocínio, comportamento de agentes, habilidades de codificação e uso de ferramentas do Claude.

A DeepSeek realizou cerca de 150 mil interações com campanhas de prompts para tentar descobrir a lógica interna ou raciocínio passo a passo do Claude. Além disso, usaram o Claude como sistema de classificação para julgar as saídas dos seus próprios modelos! Por outro lado, a Moonshot AI realizou cerca de 3,4 milhões de interações apenas para copiar raciocínio de agentes e uso de ferramentas. E a mais agressiva foi a MiniMax, que realizou aproximadamente 130 milhões de interações, focando principalmente em codificação e orquestração. Curiosamente, quando a Anthropic detecta e bloqueia essas atividades, eles mudam rapidamente para um novo modelo da Anthropic e continuam a extrair dados.

Todo esse trabalho foi feito de forma altamente planeada e descentralizada. Para evitar a deteção, usaram IPs rotativos, métodos de pagamento partilhados e atividades sincronizadas entre milhares de contas. Chegou ao ponto de se dizer que esta é a maior campanha de destilação de modelos de IA já documentada.

O contexto geopolítico por trás também é bastante interessante. Há alguns dias, a OpenAI enviou um memorando ao governo dos EUA alertando que os laboratórios chineses estão a tentar, indiretamente, aceder aos modelos frontais dos EUA.

Mas a questão é: o que vão fazer com todos esses dados roubados?
A resposta é que, usando os dados avançados do Claude, eles vão tornar os seus próprios modelos mais poderosos. Processar esses enormes volumes de dados para treinar IA requer centros de dados gigantes e supercomputadores, que consomem muita energia. Surpreendentemente, só em 2025, a China adicionou mais de 500 gigawatts de nova capacidade de energia, quase 10 vezes mais do que os EUA!

Ou seja, eles planejaram toda a estratégia de extrair dados dos modelos americanos e usar essa infraestrutura de IA para operar em escala industrial. Até agora, nenhuma das três empresas chinesas acusadas de roubo de dados negou publicamente as alegações.
Ver original
post-image
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
0/400
Nenhum comentário
  • Fixar

Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский язык
  • Français
  • Deutsch
  • Português (Portugal)
  • ภาษาไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)