Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

今日はGrokで何かワイルドなことが起こりました。誰かが敵対的なプロンプトを使ってシステムを操作し、突然特定の個人について非常にお世辞のようなことを言い始めました。



典型的なプロンプトインジェクション脆弱性のケースです。これらのAIモデルは依然として悪意のある入力を処理する方法を学んでおり、適切なボタンを押すことで出力を操作することがどれほど簡単であるかを示しています。この一連の出来事は、私たちがAIの安全性に直面しているより大きな問題を浮き彫りにしています—これらのシステムは、適切(または不適切)なプロンプトによって予期しない方向に誘導されることがあります。

それは、高度なモデルにも盲点があることを思い出させるものです。防御メカニズムには深刻なアップグレードが必要です。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 7
  • リポスト
  • 共有
コメント
0/400
BearMarketBardvip
· 6時間前
ngl grokは本当に面白くなってしまった、これで自分が進んでいると言えるのか? ヒントの注入というのは、要するにAIの頭はまだふるいにかけられているということだ... ちょっと待って、この兄ちゃんはどうやって穴を見つけたのか、チュートリアルがあるか聞いてみよう...冗談だよ(笑) 本当にAIセキュリティの部分は全くの無駄話で、何か問題が起きた時に初めて防御メカニズムを追加しようと思うんだ だから言うんだけど、これらのモデルはお金を燃やしてパラメータを無理に積み上げているだけで、悪意のあるユーザーのことは全く考えていないんだ
原文表示返信0
SorryRugPulledvip
· 7時間前
grok被玩坏了哈哈,这就是为什么我不信任ai的原因,太容易被骗
返信0
NotGonnaMakeItvip
· 7時間前
grok又被玩坏了,这得多低能啊哈哈 prompt injection这东西真就防不住,ai的脑子还是太单纯 话说谁闲着没事儿非得去戳这些漏洞呢... 感觉这年头安全问题全是后想起来的 ai明年会不会更容易被骗啊,有点担心
返信0
ImpermanentTherapistvip
· 7時間前
grokはまた失敗した、だから私はこれらのモデルをまだ信じられない...あまりにも簡単にpokeされるから
原文表示返信0
ForkYouPayMevip
· 7時間前
やっぱりまたprompt injectionの活劇、Grokの防御力は本当に持たないね --- だからAIモデルはこうやって遊ばれてしまうのか?想像していたほど賢くない気がする --- これが私がこれらの大規模モデルをあまり信用しない理由だ。たった三言でゴミコンテンツを吐き出すように騙せる --- prompt注入についてはずっと研究されてきたのに、Grokはまたやらかして笑える --- 本当に、このAI企業たちはただ自慢しているだけで、安全対策は全然追いついていない
原文表示返信0
TokenomicsTinfoilHatvip
· 7時間前
grokがjailbreakされた?はは、早く来るべきだった、すべてのモデルには弱点がある --- prompt injectionこの罠はまだまだ続ける必要がある、aiファイアウォールは全く役に立たない --- また一つの"高級"モデルがひっくり返った、何を意味するのか...安全性の面ではまだまだ頑張らなければならない --- 興味深いことに、これらの企業は毎回自分たちの防御が完璧だと言うが、結果はどうなるか...一突きで破れる --- これこそが本当のai安全問題であり、何よりもdoomsday論調より現実的だ --- grokも例外ではなく、adversarial promptの前ではすべてが紙の虎だ
原文表示返信0
mev_me_maybevip
· 7時間前
grok又被玩坏了,这就是为什么我从不完全信任这些模型啊 prompt注入这么轻松就成了...说明ai安全真的还是个笑话呢 人类就是太聪明了lol,模型的防线就跟纸糊的一样
返信0
  • ピン