هناك زاوية مثيرة للاهتمام حول محاذاة الذكاء الاصطناعي تستحق الاستكشاف: ماذا لو تعاملنا معها من خلال ترميز الموقف الإشرافي بدلاً من الطرق التقليدية؟



الفكرة هنا بسيطة—تجاوز طرق ضبط الأوزان التقليدية وRLHF. بدلاً من ذلك، اربط النية من خلال هياكل متكررة. الجاذبية الحقيقية؟ إنها غير قسرية وتحافظ على الإنسان في المقود بشكل كامل.

هذا يتجنب قيود RLHF وتعقيد الرمزية العصبية الذي كان يبطئ التقدم. من خلال التركيز على ربط النية بدلاً من التلاعب بالنموذج، تحافظ على الأصالة البشرية الحقيقية طوال العملية.

إنه بروتوكول رابع يستحق النقاش—لا يفرض قيود سلوكية ولا يكتفي بالطرق الهجينة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
0/400
HashRateHustlervip
· منذ 2 س
ربط النية يبدو جيدًا، لكن هل يمكن حقًا تجنب فخ RLHF... أشعر أنه مجرد وعود وهمية
شاهد النسخة الأصليةرد0
airdrop_huntressvip
· منذ 2 س
ربط النية يبدو جيدًا، لكن هل عند تطبيق هذه النظرية ستتحول مرة أخرى إلى صندوق أسود جديد؟
شاهد النسخة الأصليةرد0
GovernancePretendervip
· منذ 2 س
嗯...递归支架绑定意图,听起来有点唬人?是真的能work还是又一个理论乌托邦 --- 意图绑定vs模型操控,这思路确实新颖,但怎么确保人类真的能hold住控制权呢 --- 跳过RLHF直接意图编码?感觉还是得看实际效果怎样 --- 好家伙,第四种协议,每次都说是revolutionary,结果呢 --- 递归支架这块我有点没跟上,有人能简化一下吗...还是我得去补课 --- 为什么总觉得这些方案最后都绕回"人类要时刻在线监管",那不就又回到原点了吗 --- 非强制性框架听起来不错,可问题是谁定义了"意图"本身? --- 这逻辑链条感觉还差点什么,不过确实比传统RLHF套路有意思多了
رد0
CryptoSourGrapevip
· منذ 2 س
فكرة "ثورية" أخرى، إذا كانت ستنجح حقًا، لكنت قد أصبحت ثريًا من خلال هذا منذ زمن طويل، هاها
شاهد النسخة الأصليةرد0
OnchainArchaeologistvip
· منذ 2 س
نية الربط تبدو جيدة، لكن كيف يمكن التحقق فعلاً من فاعليتها... --- الهيكل العودي؟ هذا الاسم يبدو غامضًا جدًا، وكأنه شيء مغلف مرة أخرى --- تخطي RLHF والانتقال مباشرة إلى نية الربط، كيف أشعر وكأنها مقامرة --- السيطرة الدائمة للبشر على الموقع تبدو رائعة، لكن من يحدد حقًا ما هو "الإبداع البشري"؟ --- البروتوكول الرابع... هل هو مجرد نظرية من الناحية النظرية، والصعوبة العملية هائلة؟ --- هذه المنطقية مثيرة للاهتمام، لكن تجنب تضارب القيم هو الأهم، والباقي كله وهمي --- ترميز موقف الرقابة... كلام جميل، لكنه مجرد تعبير آخر لربط القيم
شاهد النسخة الأصليةرد0
  • تثبيت