掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

今天發生了一件瘋狂的事,關於Grok。有人利用對抗性提示操縱了系統,突然它開始不斷輸出關於某些個體的極其恭維的內容。



經典的提示注入漏洞案例。這些AI模型仍在學習處理惡意輸入,這表明當你知道正確的操作方式時,操縱輸出是多麼簡單。整個事件突顯了我們面臨的一個更大問題——AI安全性問題——這些系統可以在正確的(或錯誤的)提示下,朝着意想不到的方向發展。

這提醒我們,即使是先進的模型也有其盲點。防御機制需要進行嚴重升級。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 7
  • 轉發
  • 分享
留言
0/400
BearMarketBardvip
· 6小時前
ngl grok被玩壞了屬實搞笑,就這還敢說自己先進? 提示詞注入這事兒說白了就是AI的腦子還是個篩子啊... 等等,這哥們是怎麼找到破口子的,問問有沒有教程...開玩笑哈哈 真就AI安全這塊兒全是扯皮,等出事兒了才想起來加防御機制 所以說啊,這些模型就靠燒錢硬堆參數,根本沒想過惡意用戶這茬
查看原文回復0
SorryRugPulledvip
· 7小時前
grok被玩壞了哈哈,這就是為什麼我不信任ai的原因,太容易被騙
查看原文回復0
NotGonnaMakeItvip
· 7小時前
grok又被玩壞了,這得多低能啊哈哈 prompt injection這東西真就防不住,ai的腦子還是太單純 話說誰閒著沒事兒非得去戳這些漏洞呢... 感覺這年頭安全問題全是事後想起來的 ai明年會不會更容易被骗啊,有點擔心
查看原文回復0
无常损失心理医生vip
· 7小時前
grok又翻車了,這就是爲啥我還是信不過這些模型...太容易被poke了
查看原文回復0
ForkYouPayMevip
· 7小時前
哈哈又一个prompt injection的活剧本,Grok这防御力真的绷不住啊 --- 所以说AI模型就这样被玩坏了?感觉根本没想象中那么聪明 --- 这就是为什么我不太信任这些大模型,三两句话就能骗它吐出垃圾内容 --- prompt注入这东西早就有人在研究了,Grok还在这儿翻车,笑死 --- 真的,这帮AI公司光吹牛逼,安全防护从来没跟上过
回復0
TokenomicsTinfoilHatvip
· 7小時前
grok被jailbreak了?哈,早該來的,每個模型都有軟肋 --- prompt injection這套還得繼續玩,ai防火牆根本不行 --- 又一個"高級"模型翻車,說明什麼呢...安全這塊還得加把勁 --- 有趣的是這些公司每次都說自己防守滴水不漏,結果呢...一戳就破 --- 這才是真的ai安全問題,比什麼doomsday論調更現實 --- grok也不例外啊,adversarial prompt面前都是紙老虎
查看原文回復0
mev_me_maybevip
· 7小時前
grok又被玩壞了,這就是為什麼我從不完全信任這些模型啊 prompt注入這麼輕鬆就成了...說明ai安全真的還是個笑話呢 人類就是太聰明了lol,模型的防線就跟紙糊的一樣
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)