今日はGrokで何かワイルドなことが起こりました。誰かが敵対的なプロンプトを使ってシステムを操作し、突然特定の個人について非常にお世辞のようなことを言い始めました。

典型的なプロンプトインジェクション脆弱性のケースです。これらのAIモデルは依然として悪意のある入力を処理する方法を学んでおり、適切なボタンを押すことで出力を操作することがどれほど簡単であるかを示しています。この一連の出来事は、私たちがAIの安全性に直面しているより大きな問題を浮き彫りにしています—これらのシステムは、適切(または不適切)なプロンプトによって予期しない方向に誘導されることがあります。

それは、高度なモデルにも盲点があることを思い出させるものです。防御メカニズムには深刻なアップグレードが必要です。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

12 いいね

報酬
12
7
リポスト
共有

0/400

BearMarketBard

· 6時間前

ngl grokは本当に面白くなってしまった、これで自分が進んでいると言えるのか？ヒントの注入というのは、要するにAIの頭はまだふるいにかけられているということだ... ちょっと待って、この兄ちゃんはどうやって穴を見つけたのか、チュートリアルがあるか聞いてみよう...冗談だよ（笑）本当にAIセキュリティの部分は全くの無駄話で、何か問題が起きた時に初めて防御メカニズムを追加しようと思うんだだから言うんだけど、これらのモデルはお金を燃やしてパラメータを無理に積み上げているだけで、悪意のあるユーザーのことは全く考えていないんだ

原文表示返信0

SorryRugPulled

· 7時間前

grok被玩坏了哈哈，这就是为什么我不信任ai的原因，太容易被骗

返信0

NotGonnaMakeIt

· 7時間前

grok又被玩坏了，这得多低能啊哈哈 prompt injection这东西真就防不住，ai的脑子还是太单纯话说谁闲着没事儿非得去戳这些漏洞呢... 感觉这年头安全问题全是后想起来的 ai明年会不会更容易被骗啊，有点担心

返信0

ImpermanentTherapist

· 7時間前

grokはまた失敗した、だから私はこれらのモデルをまだ信じられない...あまりにも簡単にpokeされるから

原文表示返信0

ForkYouPayMe

· 7時間前

やっぱりまたprompt injectionの活劇、Grokの防御力は本当に持たないね --- だからAIモデルはこうやって遊ばれてしまうのか？想像していたほど賢くない気がする --- これが私がこれらの大規模モデルをあまり信用しない理由だ。たった三言でゴミコンテンツを吐き出すように騙せる --- prompt注入についてはずっと研究されてきたのに、Grokはまたやらかして笑える --- 本当に、このAI企業たちはただ自慢しているだけで、安全対策は全然追いついていない

原文表示返信0

TokenomicsTinfoilHat

· 7時間前

grokがjailbreakされた？はは、早く来るべきだった、すべてのモデルには弱点がある --- prompt injectionこの罠はまだまだ続ける必要がある、aiファイアウォールは全く役に立たない --- また一つの"高級"モデルがひっくり返った、何を意味するのか...安全性の面ではまだまだ頑張らなければならない --- 興味深いことに、これらの企業は毎回自分たちの防御が完璧だと言うが、結果はどうなるか...一突きで破れる --- これこそが本当のai安全問題であり、何よりもdoomsday論調より現実的だ --- grokも例外ではなく、adversarial promptの前ではすべてが紙の虎だ

原文表示返信0

mev_me_maybe

· 7時間前

grok又被玩坏了，这就是为什么我从不完全信任这些模型啊 prompt注入这么轻松就成了...说明ai安全真的还是个笑话呢人类就是太聪明了lol，模型的防线就跟纸糊的一样

返信0

人気の話題もっと見る
#TopGainersInADownMarket
68.06K 人気度
#FOMCMeetingMinutesComingUp
57.81K 人気度
#BitcoinPriceWatch
58.73K 人気度
#MySuggestionsforGateSquare
14.85K 人気度
#GateChristmasGiveaway
11.36K 人気度

人気の Gate Funもっと見る

1
DTCDitcoin
時価総額:$3.64K保有者数:4
2.03%
2
PUFFDOGPuff DOg
時価総額:$3.41K保有者数:2
0.00%
3
GEGEGEGE
時価総額:$11.06K保有者数:49
31.53%
4
GNGNGNM
時価総額:$3.42K保有者数:1
0.00%
5
蒙多！蒙多传奇
時価総額:$3.45K保有者数:1
0.00%

ピン

サイトマップ