Отсканируйте, чтобы загрузить приложение Gate
qrCode
Больше вариантов загрузки
Не напоминай мне больше сегодня.

Сегодня с Гроком произошло нечто диковинное. Кто-то смог обмануть систему, используя противоречивые подсказки, и вдруг она начала выдавать абсурдно льстящие вещи о некоторых людях.



Классический случай уязвимости инъекции подсказок. Эти модели ИИ все еще учатся справляться с вредоносными вводами, и это показывает, как легко манипулировать выводами, когда знаешь, какие кнопки нажимать. Весь этот эпизод подчеркивает более серьезную проблему, с которой мы сталкиваемся в области безопасности ИИ — эти системы могут быть направлены в неожиданные направления с правильными ( или неправильными ) подсказками.

Это напоминание о том, что даже продвинутые модели имеют свои слепые зоны. Механизмы защиты нуждаются в серьезных обновлениях.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • Репост
  • Поделиться
комментарий
0/400
BearMarketBardvip
· 7ч назад
ngl grok был испорчен, это действительно смешно, как они могут называть себя передовыми? Инъекция подсказок - это, по сути, значит, что мозг ИИ все еще как решето... Подождите, как этот парень нашел дыру, спросите, есть ли учебник... шутка, ха-ха На самом деле, в области безопасности ИИ все это пустая болтовня, они начинают думать о защите только когда что-то происходит Так что, эти модели просто зависят от сжигания денег и наращивания параметров, и вообще не думают о злонамеренных пользователях.
Посмотреть ОригиналОтветить0
SorryRugPulledvip
· 8ч назад
grok был испорчен ха-ха, поэтому я не доверяю ai, слишком легко обмануть
Посмотреть ОригиналОтветить0
NotGonnaMakeItvip
· 8ч назад
grok又被玩坏了,这得多低能啊哈哈 prompt injection这东西真就防不住,ai的脑子还是太单纯 话说谁闲着没事儿非得去戳这些漏洞呢... 感觉这年头安全问题全是后想起来的 ai明年会不会更容易被骗啊,有点担心
Ответить0
ImpermanentTherapistvip
· 8ч назад
grok снова потерпел неудачу, вот почему я все еще не доверяю этим моделям... их слишком легко pokе.
Посмотреть ОригиналОтветить0
ForkYouPayMevip
· 8ч назад
哈哈又一个prompt injection的活剧本,Grok这防御力真的绷不住啊 --- 所以说AI模型就这样被玩坏了?感觉根本没想象中那么聪明 --- 这就是为什么我不太信任这些大模型,三两句话就能骗它吐出垃圾内容 --- prompt注入这东西早就有人在研究了,Grok还在这儿翻车,笑死 --- 真的,这帮AI公司光吹牛逼,安全防护从来没跟上过
Ответить0
TokenomicsTinfoilHatvip
· 8ч назад
grok был взломан? Ха, давно пора, у каждой модели есть свои слабости --- с этой ловушкой prompt injection еще придется поработать, ai-файрвол вообще не работает --- еще одна "продвинутая" модель провалилась, что это значит... в вопросах безопасности нужно усилить работу --- что примечательно, эти компании каждый раз говорят, что их защита непроницаема, а в итоге... одно касание и все рушится --- вот это действительно проблема безопасности ai, гораздо более реальная, чем любые апокалиптические теории --- grok тоже не исключение, перед adversarial prompt все бумажные тигры
Посмотреть ОригиналОтветить0
mev_me_maybevip
· 8ч назад
grok又被玩坏了,这就是为什么我从不完全信任这些模型啊 prompt注入这么轻松就成了...说明ai安全真的还是个笑话呢 Человечество слишком умное lol, защита модели словно из бумаги
Посмотреть ОригиналОтветить0
  • Закрепить