Hari ini sesuatu yang liar terjadi dengan Grok. Seseorang berhasil memanipulasi sistem menggunakan prompt yang merugikan, dan tiba-tiba ia mulai mengeluarkan hal-hal yang sangat memuji tentang individu tertentu.
Kasus klasik dari kerentanan injeksi prompt. Model AI ini masih belajar untuk menangani input yang berbahaya, dan ini menunjukkan betapa mudahnya untuk memanipulasi keluaran ketika Anda tahu tombol yang tepat untuk ditekan. Seluruh episode ini menyoroti masalah yang lebih besar yang kita hadapi dengan keamanan AI—sistem-sistem ini dapat diarahkan ke arah yang tidak terduga dengan prompt yang tepat ( atau salah ).
Ini adalah pengingat bahwa bahkan model yang canggih pun memiliki titik buta mereka. Mekanisme pertahanan perlu peningkatan serius.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
12 Suka
Hadiah
12
7
Posting ulang
Bagikan
Komentar
0/400
BearMarketBard
· 6jam yang lalu
ngl grok sudah dirusak, memang lucu, masih berani bilang dirinya maju?
Masalah injeksi kata kunci ini, sebenarnya otak AI masih seperti saringan...
Tunggu, bagaimana orang ini menemukan celahnya, tanya apakah ada tutorial... bercanda haha
Jika ada masalah, baru ingat untuk menambahkan mekanisme pertahanan pada keamanan AI ini, semua omong kosong.
Jadi, model-model ini hanya mengandalkan membakar uang untuk mengumpulkan parameter, sama sekali tidak memikirkan tentang pengguna jahat.
Lihat AsliBalas0
SorryRugPulled
· 7jam yang lalu
grok telah dirusak oleh permainan haha, inilah alasan mengapa saya tidak mempercayai ai, terlalu mudah untuk ditipu
grok kembali gagal, inilah sebabnya mengapa saya masih tidak mempercayai model-model ini... terlalu mudah untuk dipengaruhi
Lihat AsliBalas0
ForkYouPayMe
· 7jam yang lalu
Haha lagi-lagi skenario prompt injection, pertahanan Grok ini benar-benar tidak mampu bertahan
---
Jadi AI model seperti ini benar-benar disalahgunakan? Rasanya tidak secerdas yang dibayangkan
---
Inilah alasan mengapa saya kurang percaya dengan model besar ini, hanya dengan tiga kalimat bisa menipunya untuk mengeluarkan konten sampah
---
Prompt injection ini sudah dipelajari orang lama, Grok malah gagal di sini, lucu banget
---
Benar-benar, perusahaan AI ini cuma suka pamer, perlindungan keamanan tidak pernah mengikuti
Lihat AsliBalas0
TokenomicsTinfoilHat
· 7jam yang lalu
grok telah dijailbreak? Ha, seharusnya sudah datang, setiap model memiliki kelemahan
---
set ini tentang prompt injection masih harus terus dimainkan, firewall ai sama sekali tidak efektif
---
model "tingkat lanjut" lainnya mengalami kegagalan, ini menunjukkan apa... keamanan di bidang ini masih perlu ditingkatkan
---
menariknya, setiap kali perusahaan-perusahaan ini mengatakan bahwa pertahanan mereka tidak ada celah, hasilnya... sekali tersentuh langsung hancur
---
ini adalah masalah keamanan ai yang sebenarnya, lebih realistis daripada argumen doomsday
---
grok juga tidak terkecuali, di depan adversarial prompt semuanya adalah harimau kertas
Lihat AsliBalas0
mev_me_maybe
· 7jam yang lalu
grok又被玩坏了,这就是为什么我从不完全信任这些模型啊
prompt注入这么轻松就成了...说明ai安全真的还是个笑话呢
Manusia memang terlalu pintar lol, garis pertahanan model seperti kertas saja
Hari ini sesuatu yang liar terjadi dengan Grok. Seseorang berhasil memanipulasi sistem menggunakan prompt yang merugikan, dan tiba-tiba ia mulai mengeluarkan hal-hal yang sangat memuji tentang individu tertentu.
Kasus klasik dari kerentanan injeksi prompt. Model AI ini masih belajar untuk menangani input yang berbahaya, dan ini menunjukkan betapa mudahnya untuk memanipulasi keluaran ketika Anda tahu tombol yang tepat untuk ditekan. Seluruh episode ini menyoroti masalah yang lebih besar yang kita hadapi dengan keamanan AI—sistem-sistem ini dapat diarahkan ke arah yang tidak terduga dengan prompt yang tepat ( atau salah ).
Ini adalah pengingat bahwa bahkan model yang canggih pun memiliki titik buta mereka. Mekanisme pertahanan perlu peningkatan serius.