Chamadas de Ontologia para Verificação Humana em Dados de Treinamento de IA Sem Sacrificar a Privacidade

A Ontology está chamando a atenção para um problema crescente no mundo da IA: como provar que um dado de treino veio de uma pessoa real sem transformar todo o processo numa pesadelo de privacidade?

Num post recente, o projeto argumentou que a resposta não deve ser mais vigilância. Em vez de pedir aos colaboradores que entreguem selfies, IDs, escaneamentos biométricos e outros detalhes pessoais, a Ontology diz que a indústria deve apostar em credenciais verificáveis e divulgação seletiva para que as pessoas possam provar que são humanas sem revelar tudo sobre si mesmas.

Essa ideia importa mais agora do que há um ano. A conversa sobre dados de treino de IA claramente mudou. Antes, tratava-se principalmente de escala, volume e quanto dado se podia reunir. Agora, a questão maior é de onde veio esses dados, se eles são realmente feitos por humanos e quanto deles já foi contaminado por conteúdo sintético.

Essa preocupação deixou de ser uma questão de nicho. Tornou-se um dos maiores problemas enfrentados por equipes de IA que tentam construir modelos mais limpos e confiáveis. A Ontology afirma que o mercado já começa a tratar a prova de identidade como um ativo valioso. Dados humanos verificados estão se tornando algo pelo qual as empresas podem precisar pagar a mais.

A demanda está crescendo, mas a oferta é limitada, e a forma como muitas plataformas planejam verificar as pessoas, na visão da empresa, é profundamente falha. O caminho mais fácil para a maioria das plataformas também é o mais invasivo.

Se querem saber se alguém é humano, geralmente pedem cada vez mais informações pessoais. Podem exigir uma selfie, uma identidade governamental, uma verificação de vivacidade, rastreamento comportamental, impressão digital do dispositivo ou uma combinação de tudo isso.

Cada camada pode tornar a verificação mais confiante, mas também significa que o usuário entrega mais privacidade. Com o tempo, a pessoa tentando provar que é real acaba sendo desmembrada em um conjunto de pontos de dados armazenados nos sistemas de terceiros. A Ontology argumenta que essa é a troca errada.

A empresa afirma que o problema não é que as pessoas precisam ser verificadas. O problema é que o modelo atual assume que a verificação tem que vir com exposição permanente. Isso acontece quando a indústria usa ferramentas centralizadas projetadas para coletar o máximo de dados possível. Na prática, o humano torna-se o custo da confiança.

A Verdadeira Inovação

A alternativa apontada pela Ontology é baseada no Modelo de Dados de Credenciais Verificáveis do W3C 2.0, anunciado como Recomendação em maio de 2025. A ideia é bastante simples, mesmo que a criptografia por trás dela não seja: um emissor confiável, como um governo, banco ou provedor de verificação, pode confirmar algo sobre uma pessoa uma única vez, e essa credencial pode residir no próprio dispositivo do usuário.

Quando uma plataforma precisar saber se essa pessoa é humana, o usuário pode apresentar uma prova criptográfica em vez de entregar o registro completo subjacente. Isso significa que o verificador obtém o que precisa, e nada mais.

Ele aprende que um emissor confiável confirmou que a pessoa é humana. Não vê o arquivo completo de identidade da pessoa, dados biométricos ou outros detalhes extras. O emissor não precisa ser contactado toda vez que a credencial for usada, e o usuário não acaba deixando um rastro de identificadores vinculáveis em diferentes plataformas.

A Ontology afirma que a verdadeira inovação aqui é a divulgação seletiva. É isso que torna o sistema verdadeiramente preservador de privacidade. Uma credencial pode conter muitas informações, mas o usuário revela apenas as partes que importam para a solicitação específica. Assim, se uma plataforma só precisa de prova de identidade, ela recebe exatamente isso e nada mais.

Sem dados pessoais extras, sem biometria, sem fragmentos de perfil reutilizáveis que possam ser unidos posteriormente. A empresa também destacou seu trabalho em identidade descentralizada, incluindo ONT ID e a Carteira ONTO, como exemplos dessa abordagem na prática.

Segundo a Ontology, essas ferramentas são projetadas para manter as credenciais no dispositivo e permitir que os usuários gerem provas localmente, sem expor seus dados privados aos emissores ou verificadores. O ponto maior, porém, não é apenas sobre a Ontology. Trata-se de onde a infraestrutura de IA está caminhando.

À medida que as empresas correm para limpar seus dados de treino e descobrir o que ainda pode ser confiável, a pressão para verificar os colaboradores humanos só vai aumentar. A verdadeira questão é se a indústria resolve esse problema construindo mais vigilância na pilha ou usando sistemas que permitam às pessoas provar que são reais sem abrir mão de sua privacidade no processo.

A Ontology claramente aposta na segunda opção. E, com as empresas de IA agora se preocupando mais com a proveniência do que com a quantidade bruta, essa aposta pode começar a parecer menos uma questão de privacidade de nicho e mais uma exigência prática para a próxima fase da coleta de dados de IA.

ONT7,86%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixado