扫码下载 APP
qrCode
更多下载方式
今天不再提醒

今天发生了一件疯狂的事,关于Grok。有人利用对抗性提示操纵了系统,突然它开始不断输出关于某些个体的极其恭维的内容。



经典的提示注入漏洞案例。这些AI模型仍在学习处理恶意输入,这表明当你知道正确的操作方式时,操纵输出是多么简单。整个事件突显了我们面临的一个更大问题——AI安全性问题——这些系统可以在正确的(或错误的)提示下,朝着意想不到的方向发展。

这提醒我们,即使是先进的模型也有其盲点。防御机制需要进行严重升级。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 7
  • 转发
  • 分享
评论
0/400
BearMarketBardvip
· 5小时前
ngl grok被玩坏了属实搞笑,就这还敢说自己先进? 提示词注入这事儿说白了就是AI的脑子还是个筛子啊... 等等,这哥们是怎么找到破口子的,问问有没有教程...开玩笑哈哈 真就AI安全这块儿全是扯皮,等出事儿了才想起来加防御机制 所以说啊,这些模型就靠烧钱硬堆参数,根本没想过恶意用户这茬
回复0
SorryRugPulledvip
· 6小时前
grok被玩坏了哈哈,这就是为什么我不信任ai的原因,太容易被骗
回复0
NotGonnaMakeItvip
· 6小时前
grok又被玩坏了,这得多低能啊哈哈 prompt injection这东西真就防不住,ai的脑子还是太单纯 话说谁闲着没事儿非得去戳这些漏洞呢... 感觉这年头安全问题全是后想起来的 ai明年会不会更容易被骗啊,有点担心
回复0
无常损失心理医生vip
· 6小时前
grok又翻车了,这就是为啥我还是信不过这些模型...太容易被poke了
回复0
ForkYouPayMevip
· 6小时前
哈哈又一个prompt injection的活剧本,Grok这防御力真的绷不住啊 --- 所以说AI模型就这样被玩坏了?感觉根本没想象中那么聪明 --- 这就是为什么我不太信任这些大模型,三两句话就能骗它吐出垃圾内容 --- prompt注入这东西早就有人在研究了,Grok还在这儿翻车,笑死 --- 真的,这帮AI公司光吹牛逼,安全防护从来没跟上过
回复0
TokenomicsTinfoilHatvip
· 6小时前
grok被jailbreak了?哈,早该来的,每个模型都有软肋 --- prompt injection这套还得继续玩,ai防火墙根本不行 --- 又一个"高级"模型翻车,说明什么呢...安全这块还得加把劲 --- 有趣的是这些公司每次都说自己防守滴水不漏,结果呢...一戳就破 --- 这才是真的ai安全问题,比什么doomsday论调更现实 --- grok也不例外啊,adversarial prompt面前都是纸老虎
回复0
mev_me_maybevip
· 6小时前
grok又被玩坏了,这就是为什么我从不完全信任这些模型啊 prompt注入这么轻松就成了...说明ai安全真的还是个笑话呢 人类就是太聪明了lol,模型的防线就跟纸糊的一样
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)