مكالمات الأنطولوجيا للتحقق البشري في بيانات تدريب الذكاء الاصطناعي دون التضحية بالخصوصية

تسلط أونتولوجي الضوء على مشكلة متزايدة في عالم الذكاء الاصطناعي: كيف تثبت أن قطعة من بيانات التدريب جاءت من شخص حقيقي دون تحويل العملية بأكملها إلى كابوس للخصوصية؟

في منشور حديث، جادل المشروع بأن الإجابة لا ينبغي أن تكون مزيدًا من المراقبة. بدلاً من طلب من المساهمين تسليم صور سيلفي، هويات، مسح بيومتري، وغيرها من التفاصيل الشخصية، تقول أونتولوجي إن الصناعة يجب أن تعتمد على الاعتمادات القابلة للتحقق والإفصاح الانتقائي حتى يتمكن الناس من إثبات أنهم بشر دون الكشف عن كل شيء عن أنفسهم.

تلك الفكرة أصبحت أكثر أهمية الآن مما كانت عليه قبل عام. لقد تغيرت بشكل واضح محادثة بيانات تدريب الذكاء الاصطناعي. كانت في السابق تركز بشكل رئيسي على الحجم والكمية ومدى جمع البيانات. الآن السؤال الأكبر هو من أين جاءت تلك البيانات، وهل هي فعلاً من صنع الإنسان، وكم منها تلوث بالفعل بمحتوى اصطناعي.

لم يعد هذا القلق قضية ثانوية. لقد أصبح أحد أكبر المشاكل التي تواجه فرق الذكاء الاصطناعي التي تحاول بناء نماذج أنظف وأكثر موثوقية. تقول أونتولوجي إن السوق بدأ بالفعل يعامل إثبات الشخصية كأصل ثمين. البيانات البشرية الموثقة أصبحت شيئًا قد تضطر الشركات لدفع مقابل إضافي من أجله.

الطلب يتزايد، لكن العرض محدود، والطريقة التي تخطط العديد من المنصات للتحقق من الأشخاص بها، في رأي الشركة، معيبة بشكل عميق. الطريق الأسهل لمعظم المنصات هو أيضًا الأكثر تدخلاً.

إذا أرادوا معرفة ما إذا كان شخص ما إنسانًا، فإنهم عادة يطلبون المزيد من المعلومات الشخصية. قد يتطلب الأمر صورة سيلفي، هوية حكومية، فحص حيوية، تتبع سلوكي، بصمة جهاز، أو مزيج من كل ذلك.

كل طبقة قد تجعل التحقق أكثر ثقة، لكنها تعني أيضًا أن المستخدم يتخلى عن مزيد من الخصوصية. مع مرور الوقت، يتم تفكيك الشخص الذي يحاول إثبات أنه حقيقي إلى مجموعة من نقاط البيانات المخزنة على أنظمة طرف آخر. تجادل أونتولوجي بأن هذا هو المقايضة الخاطئة.

تقول الشركة إن المشكلة ليست أن الناس بحاجة إلى التحقق. المشكلة أن النموذج الحالي يفترض أن التحقق يجب أن يأتي مع تعرض دائم. هذا هو ما يحدث عندما تستخدم الصناعة أدوات مركزية مصممة لجمع أكبر قدر ممكن من البيانات. في الممارسة العملية، يصبح الإنسان تكلفة الثقة.

الاختراق الحقيقي

البديل الذي تشير إليه أونتولوجي مبني حول نموذج بيانات الاعتمادات القابلة للتحقق من W3C 2.0، والذي أُعلن عنه كتوصية في مايو 2025. الفكرة بسيطة جدًا، حتى لو لم تكن التشفير وراءها كذلك: يمكن لمصدر موثوق، مثل حكومة أو بنك أو مزود تحقق، أن يؤكد شيئًا عن شخص مرة واحدة، ويمكن أن يعيش ذلك الاعتماد على جهاز المستخدم الخاص.

عندما تحتاج منصة لاحقًا إلى معرفة ما إذا كان ذلك الشخص إنسانًا، يمكن للمستخدم تقديم دليل تشفيري بدلاً من تسليم السجل الكامل الأساسي. هذا يعني أن المصدق يحصل على ما يحتاجه، ولا شيء أكثر.

يتعلم أن مصدرًا موثوقًا أكد أن الشخص إنسان. لا يرى الملف الكامل لهوية الشخص، أو بياناته البيومترية، أو تفاصيل إضافية أخرى. لا يحتاج المصدر إلى أن يتم الاتصال به في كل مرة يُستخدم فيها الاعتماد، ولا ينتهي الأمر بالمستخدم بترك أثر من معرفات قابلة للربط عبر منصات مختلفة.

تقول أونتولوجي إن الاختراق الحقيقي هنا هو الإفصاح الانتقائي. هذا هو ما يجعل النظام يحافظ على الخصوصية بشكل حقيقي. يمكن أن يحتوي الاعتماد على الكثير من المعلومات، لكن المستخدم يكشف فقط عن الأجزاء التي تهم الطلب المحدد. لذلك إذا كانت المنصة تحتاج فقط إلى إثبات الشخصية، فهي تحصل على ذلك بالضبط ولا شيء غيره.

لا بيانات شخصية إضافية، لا بيومتريات، لا أجزاء من الملف الشخصي يمكن إعادة استخدامها لاحقًا. وأشارت الشركة أيضًا إلى عملها في الهوية اللامركزية، بما في ذلك ONT ID و محفظة ONTO، كمثال على هذا النهج في الممارسة.

وفقًا لأونتولوجي، تم تصميم هذه الأدوات للحفاظ على الاعتمادات على الجهاز وتمكين المستخدمين من إنشاء الأدلة محليًا، دون كشف بياناتهم الخاصة للمصدرين أو المصدقين. النقطة الأكبر، مع ذلك، ليست فقط عن أونتولوجي. بل عن الاتجاه الذي تتجه إليه بنية الذكاء الاصطناعي.

مع تنافس الشركات على تنظيف بيانات تدريبها ومعرفة ما يمكن الاعتماد عليه، فإن الضغط للتحقق من مساهمي البشر سيستمر في الارتفاع. السؤال الحقيقي هو ما إذا كانت الصناعة ستحل تلك المشكلة ببناء مزيد من المراقبة في البنية التحتية، أو باستخدام أنظمة تتيح للناس إثبات أنهم حقيقيون دون التخلي عن خصوصيتهم أثناء العملية.

تراهن أونتولوجي بوضوح على الخيار الثاني. ومع قلق شركات الذكاء الاصطناعي الآن أكثر حول الأصلية من الكمية الخام، قد يبدأ هذا الرهان في الظهور أقل كجدل خصوصية متخصص وأكثر كمتطلب عملي للمرحلة القادمة من جمع بيانات الذكاء الاصطناعي.

ONT3.3%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • مُثبت