Онтологія вимагає людської перевірки у даних для навчання ШІ без жертви приватності

Ontology звертає увагу на зростаючу проблему у світі ШІ: як довести, що частина навчальних даних походить від реальної особи, не перетворюючи весь процес у кошмар для приватності?

У недавньому пості проект стверджував, що відповідь не повинна полягати у більшому контролі. Замість того, щоб просити учасників передавати селфі, посвідчення особи, біометричні скани та інші особисті дані, Ontology каже, що індустрія має покладатися на перевірені облікові дані та вибіркове розкриття, щоб люди могли довести, що вони люди, не розкриваючи все про себе.

Ця ідея важливіша зараз, ніж рік тому. Розмова про навчальні дані для ШІ явно змістилася. Раніше йшлося здебільшого про масштаб, обсяг і скільки даних можна зібрати. Тепер більшою питанням є, звідки ці дані, чи вони справді людські, і скільки з них вже було забруднено синтетичним контентом.

Це занепокоєння вже не є вузькою проблемою. Воно стало однією з найбільших головних болів для команд ШІ, які прагнуть створити чистіші, надійніші моделі. Ontology стверджує, що ринок уже починає сприймати підтвердження особистості як цінний актив. Перевірені людські дані стають чимось, за що компанії, можливо, доведеться платити додатково.

Попит зростає, але пропозиція обмежена, і спосіб, яким багато платформ планують перевіряти людей, на їхню думку, глибоко хибний. Найпростіший шлях для більшості платформ — це також і найінвазивніший.

Якщо вони хочуть знати, чи є хтось людиною, вони зазвичай вимагають все більше і більше особистої інформації. Вони можуть вимагати селфі, державне посвідчення особи, перевірку життєздатності, поведінкове відстеження, ідентифікацію пристрою або їхню комбінацію.

Кожен рівень може зробити перевірку більш впевненою, але це також означає, що користувач втрачає більше приватності. З часом особа, яка намагається довести, що вона реальна, розбивається на набір даних, збережених у системах інших. Ontology стверджує, що це неправильний компроміс.

Компанія каже, що проблема не в тому, що потрібно перевіряти людей. Проблема у тому, що поточна модель передбачає, що перевірка має супроводжуватися постійним розкриттям. Це те, що трапляється, коли індустрія використовує централізовані інструменти, створені для збору якомога більшої кількості даних. На практиці людина стає витратною складовою довіри.

Справжній прорив

Альтернатива, на яку вказує Ontology, побудована навколо Моделі даних перевірених облікових даних W3C 2.0, яка була оголошена рекомендацією у травні 2025 року. Ідея досить проста, навіть якщо криптографія, що її підтримує, не є: довірений видавець, наприклад уряд, банк або провайдер перевірки, може один раз підтвердити щось про особу, і цей обліковий запис може зберігатися на пристрої користувача.

Коли платформа пізніше потрібно буде дізнатися, чи є ця особа людиною, користувач може представити криптографічний доказ замість передачі всього базового запису. Це означає, що перевіряльник отримує те, що йому потрібно, і нічого більше.

Він дізнається, що довірений видавець підтвердив, що особа є людиною. Він не бачить повний файл ідентифікації, біометричних даних або інших додаткових деталей. Видавець не потребує контакту кожного разу, коли використовується обліковий запис, а користувач не залишає сліду з ідентифікаторами, що можна зв’язати між платформами.

Ontology стверджує, що справжній прорив тут — це вибіркове розкриття. Це те, що робить систему справді приватністю захищеною. Обліковий запис може містити багато інформації, але користувач розкриває лише ті частини, які важливі для конкретного запиту. Тому, якщо платформа лише потребує підтвердження особистості, вона отримує саме це і нічого більше.

Жодних додаткових особистих даних, біометрії, повторно використовуваних фрагментів профілю, які можна з’єднати пізніше. Компанія також зазначила свою роботу у сфері децентралізованої ідентичності, включаючи ONT ID та гаманець ONTO, як приклади цієї практики.

Згідно з Ontology, ці інструменти створені для збереження облікових даних на пристрої та дозволяють користувачам генерувати докази локально, не розкриваючи свої приватні дані видавцям або перевіряльникам. Головне, однак, не лише у Ontology. Це стосується того, куди рухається інфраструктура ШІ.

Оскільки компанії змагаються за очищення своїх навчальних даних і визначення, що ще можна довіряти, тиск на перевірку людських учасників лише зростатиме. Справжнє питання — чи вирішить індустрія цю проблему, впроваджуючи більше спостереження у стек, або використовуючи системи, що дозволяють людям довести, що вони реальні, не втрачаючи приватність у процесі.

Ontology явно робить ставку на другий варіант. І з урахуванням того, що компанії ШІ тепер більше турбуються про походження даних, ніж про їхній обсяг, ця ставка може почати виглядати менш як приватний аргумент і більше як практична вимога для наступної фази збору даних для ШІ.

ONT5,2%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено