今天發生了一件瘋狂的事，關於Grok。有人利用對抗性提示操縱了系統，突然它開始不斷輸出關於某些個體的極其恭維的內容。

經典的提示注入漏洞案例。這些AI模型仍在學習處理惡意輸入，這表明當你知道正確的操作方式時，操縱輸出是多麼簡單。整個事件突顯了我們面臨的一個更大問題——AI安全性問題——這些系統可以在正確的(或錯誤的)提示下，朝着意想不到的方向發展。

這提醒我們，即使是先進的模型也有其盲點。防御機制需要進行嚴重升級。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

12人點讚了這條動態

讚賞
12
7
轉發
分享

留言

0/400

BearMarketBard

· 6小時前

ngl grok被玩壞了屬實搞笑，就這還敢說自己先進？提示詞注入這事兒說白了就是AI的腦子還是個篩子啊... 等等，這哥們是怎麼找到破口子的，問問有沒有教程...開玩笑哈哈真就AI安全這塊兒全是扯皮，等出事兒了才想起來加防御機制所以說啊，這些模型就靠燒錢硬堆參數，根本沒想過惡意用戶這茬

查看原文回復0

SorryRugPulled

· 7小時前

grok被玩壞了哈哈，這就是為什麼我不信任ai的原因，太容易被騙

查看原文回復0

NotGonnaMakeIt

· 7小時前

grok又被玩壞了，這得多低能啊哈哈 prompt injection這東西真就防不住，ai的腦子還是太單純話說誰閒著沒事兒非得去戳這些漏洞呢... 感覺這年頭安全問題全是事後想起來的 ai明年會不會更容易被骗啊，有點擔心

查看原文回復0

无常损失心理医生

· 7小時前

grok又翻車了，這就是爲啥我還是信不過這些模型...太容易被poke了

查看原文回復0

ForkYouPayMe

· 7小時前

哈哈又一个prompt injection的活剧本，Grok这防御力真的绷不住啊 --- 所以说AI模型就这样被玩坏了？感觉根本没想象中那么聪明 --- 这就是为什么我不太信任这些大模型，三两句话就能骗它吐出垃圾内容 --- prompt注入这东西早就有人在研究了，Grok还在这儿翻车，笑死 --- 真的，这帮AI公司光吹牛逼，安全防护从来没跟上过

回復0

TokenomicsTinfoilHat

· 7小時前

grok被jailbreak了？哈，早該來的，每個模型都有軟肋 --- prompt injection這套還得繼續玩，ai防火牆根本不行 --- 又一個"高級"模型翻車，說明什麼呢...安全這塊還得加把勁 --- 有趣的是這些公司每次都說自己防守滴水不漏，結果呢...一戳就破 --- 這才是真的ai安全問題，比什麼doomsday論調更現實 --- grok也不例外啊，adversarial prompt面前都是紙老虎

查看原文回復0

mev_me_maybe

· 7小時前

grok又被玩壞了，這就是為什麼我從不完全信任這些模型啊 prompt注入這麼輕鬆就成了...說明ai安全真的還是個笑話呢人類就是太聰明了lol，模型的防線就跟紙糊的一樣

查看原文回復0

熱門話題查看更多
#逆勢上漲幣種推薦
6.8萬熱度
#美聯儲會議紀要將公佈
5.78萬熱度
#比特幣行情觀察
5.87萬熱度
#我對Gate廣場的建議分享
1.48萬熱度
#Gate廣場聖誕送溫暖
1.13萬熱度

熱門 Gate Fun查看更多

1
DTCDitcoin
市值:$3649.7持有人數:4
2.03%
2
PUFFDOGPuff DOg
市值:$3415.39持有人數:2
0.00%
3
GEGEGEGE
市值:$1.1萬持有人數:48
31.53%
4
GNGNGNM
市值:$3424.13持有人數:1
0.00%
5
蒙多！蒙多传奇
市值:$3455.17持有人數:1
0.00%