امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

اليوم حدث شيء غريب مع Grok. تمكن شخص ما من استغلال النظام باستخدام مطالبات عدائية، وفجأة بدأ يخرج أشياء مبالغ فيها ومدح مفرط عن بعض الأفراد.



حالة كلاسيكية من ثغرة حقن الطلب. لا تزال هذه النماذج الذكية تتعلم كيفية التعامل مع المدخلات الخبيثة، ويظهر ذلك مدى سهولة التلاعب بالمخرجات عندما تعرف الأزرار الصحيحة التي يجب الضغط عليها. تسلط هذه الحلقة الضوء على مشكلة أكبر نواجهها مع سلامة الذكاء الاصطناعي - يمكن توجيه هذه الأنظمة في اتجاهات غير متوقعة مع الطلبات الصحيحة ( أو الخاطئة ).

إنه تذكير بأن النماذج المتقدمة لديها نقاط عمياء. تحتاج آليات الدفاع إلى تحديثات جدية.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • إعادة النشر
  • مشاركة
تعليق
0/400
BearMarketBardvip
· منذ 8 س
صحيح أن ngl grok تم تدميره وهذا مضحك حقًا، كيف يجرؤ على القول إنه متقدم؟ باختصار، مسألة حقن الكلمات المفتاحية تعني أن عقل الذكاء الاصطناعي لا يزال مصفاة... انتظر، كيف تمكن هذا الرجل من العثور على الثغرة، هل يمكن أن نسأل إذا كان هناك دروس تعليمية... أمزح ههههه حقًا، كل ما يتعلق بأمان الذكاء الاصطناعي هو مجرد كلام فارغ، وعندما تحدث مشكلة، يتذكرون فقط إضافة آليات الدفاع لذلك، تعتمد هذه النماذج على حرق المال وزيادة المعلمات، ولم يفكروا أبدًا في المستخدمين الخبيثين.
شاهد النسخة الأصليةرد0
SorryRugPulledvip
· منذ 8 س
grok تم العبث به بشكل ساخر، لهذا أنا لا أثق في الذكاء الاصطناعي، من السهل أن يُخدع
شاهد النسخة الأصليةرد0
NotGonnaMakeItvip
· منذ 8 س
grok又被玩坏了,这得多低能啊哈哈 prompt injection这东西真就防不住,ai的脑子还是太单纯 话说谁闲着没事儿非得去戳这些漏洞呢... 感觉这年头安全问题全是后想起来的 ai明年会不会更容易被骗啊,有点担心
رد0
ImpermanentTherapistvip
· منذ 8 س
لقد فشلت Grok مرة أخرى، وهذا هو السبب في أنني لا أزال لا أثق بهذه النماذج... من السهل جدًا أن تتعرض للغش.
شاهد النسخة الأصليةرد0
ForkYouPayMevip
· منذ 8 س
哈哈又一个prompt injection的活剧本,Grok这防御力真的绷不住啊 --- 所以说AI模型就这样被玩坏了?感觉根本没想象中那么聪明 --- 这就是为什么我不太信任这些大模型,三两句话就能骗它吐出垃圾内容 --- prompt注入这东西早就有人在研究了,Grok还在这儿翻车,笑死 --- 真的,这帮AI公司光吹牛逼,安全防护从来没跟上过
رد0
TokenomicsTinfoilHatvip
· منذ 8 س
grok تم اختراقه؟ ها، كان هذا متوقعًا، كل نموذج له نقطة ضعف --- لا بد من الاستمرار في لعب هذه الفخ، جدار الحماية AI غير فعال على الإطلاق --- نموذج "متقدم" آخر ينهار، ماذا يعني هذا... يجب أن نعمل بجد أكبر على الأمن --- المثير للاهتمام هو أن هذه الشركات تقول دائمًا إن دفاعها محكم، ولكن النتيجة... ضغطة واحدة وتنهار --- هذه هي المشكلة الحقيقية في أمان AI، أكثر واقعية من أي كلام عن نهاية العالم --- grok ليس استثناءً، أمام الموجهات العدائية كلها نمور ورقية
شاهد النسخة الأصليةرد0
mev_me_maybevip
· منذ 8 س
grok又被玩坏了,这就是为什么我从不完全信任这些模型啊 prompt注入这么轻松就成了...说明 ai الأمن الحقيقي لا يزال مجرد مزحة الإنسان هو ببساطة ذكي جدًا lol، خط دفاع النموذج هو كأنه ورق فقط
شاهد النسخة الأصليةرد0
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$3.36Kعدد الحائزين:2
    0.28%
  • القيمة السوقية:$3.61Kعدد الحائزين:4
    0.97%
  • القيمة السوقية:$3.41Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$10.12Kعدد الحائزين:62
    27.70%
  • القيمة السوقية:$3.42Kعدد الحائزين:1
    0.00%
  • تثبيت