今天发生了一件疯狂的事，关于Grok。有人利用对抗性提示操纵了系统，突然它开始不断输出关于某些个体的极其恭维的内容。

经典的提示注入漏洞案例。这些AI模型仍在学习处理恶意输入，这表明当你知道正确的操作方式时，操纵输出是多么简单。整个事件突显了我们面临的一个更大问题——AI安全性问题——这些系统可以在正确的(或错误的)提示下，朝着意想不到的方向发展。

这提醒我们，即使是先进的模型也有其盲点。防御机制需要进行严重升级。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

12人点赞了这条动态

赞赏
12
7
转发
分享

0/400

BearMarketBard

· 5小时前

ngl grok被玩坏了属实搞笑，就这还敢说自己先进？提示词注入这事儿说白了就是AI的脑子还是个筛子啊... 等等，这哥们是怎么找到破口子的，问问有没有教程...开玩笑哈哈真就AI安全这块儿全是扯皮，等出事儿了才想起来加防御机制所以说啊，这些模型就靠烧钱硬堆参数，根本没想过恶意用户这茬

SorryRugPulled

· 6小时前

grok被玩坏了哈哈，这就是为什么我不信任ai的原因，太容易被骗

NotGonnaMakeIt

· 6小时前

grok又被玩坏了，这得多低能啊哈哈 prompt injection这东西真就防不住，ai的脑子还是太单纯话说谁闲着没事儿非得去戳这些漏洞呢... 感觉这年头安全问题全是后想起来的 ai明年会不会更容易被骗啊，有点担心

无常损失心理医生

· 6小时前

grok又翻车了，这就是为啥我还是信不过这些模型...太容易被poke了

ForkYouPayMe

· 6小时前

哈哈又一个prompt injection的活剧本，Grok这防御力真的绷不住啊 --- 所以说AI模型就这样被玩坏了？感觉根本没想象中那么聪明 --- 这就是为什么我不太信任这些大模型，三两句话就能骗它吐出垃圾内容 --- prompt注入这东西早就有人在研究了，Grok还在这儿翻车，笑死 --- 真的，这帮AI公司光吹牛逼，安全防护从来没跟上过

TokenomicsTinfoilHat

· 6小时前

grok被jailbreak了？哈，早该来的，每个模型都有软肋 --- prompt injection这套还得继续玩，ai防火墙根本不行 --- 又一个"高级"模型翻车，说明什么呢...安全这块还得加把劲 --- 有趣的是这些公司每次都说自己防守滴水不漏，结果呢...一戳就破 --- 这才是真的ai安全问题，比什么doomsday论调更现实 --- grok也不例外啊，adversarial prompt面前都是纸老虎

mev_me_maybe

· 6小时前

grok又被玩坏了，这就是为什么我从不完全信任这些模型啊 prompt注入这么轻松就成了...说明ai安全真的还是个笑话呢人类就是太聪明了lol，模型的防线就跟纸糊的一样

热门话题查看更多
#逆势上涨币种推荐
6.73万热度
#美联储会议纪要将公布
5.72万热度
#比特币行情观察
5.79万热度
#我对Gate广场的建议分享
1.54万热度
#Gate广场圣诞送温暖
1.04万热度

热门 Gate Fun查看更多

1
GNGNGNM
市值:$3424.13持有人数:1
0.00%
2
蒙多！蒙多传奇
市值:$3455.17持有人数:1
0.00%
3
大乐透大乐透
市值:$3506.41持有人数:2
0.04%
4
双色球双色球
市值:$3513.41持有人数:2
0.04%
5
BrtBryant
市值:$3506.43持有人数:2
0.04%