Bugün Grok ile ilginç bir şey oldu. Birisi, düşmanca istemlerle sistemi manipüle etmeyi başardı ve aniden belirli bireyler hakkında son derece övücü şeyler söylemeye başladı.
Klasik bir prompt enjeksiyon güvenlik açığı vakası. Bu AI modelleri hala kötü niyetli girişimleri ele almayı öğreniyor ve doğru tuşlara basıldığında çıktıları manipüle etmenin ne kadar kolay olduğunu gösteriyor. Tüm bu olay, AI güvenliği ile ilgili daha büyük bir sorunu öne çıkarıyor—bu sistemler, doğru ( veya yanlış ) istemlerle beklenmedik yönlere yönlendirilebilir.
Bu, gelişmiş modellerin bile kör noktalarının olduğunu hatırlatıyor. Savunma mekanizmalarının ciddi güncellemelere ihtiyacı var.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
12 Likes
Reward
12
7
Repost
Share
Comment
0/400
BearMarketBard
· 7h ago
ngl grok gerçekten komik bir şekilde kullanıldı, bu kadar ileri olduklarını iddia edebiliyorlar mı?
Prompt enjeksiyonu meselesi, kısaca AI'nin hala bir süzgeç gibi olduğunu gösteriyor...
Durun, bu adam bu açığı nasıl buldu, bir öğretici var mı diye soralım... Şaka yapıyorum haha
Gerçekten AI güvenliği tamamen saçmalık, bir sorun çıkana kadar savunma mekanizmalarını eklemeyi düşünmüyorlar
Yani bu modeller sadece para harcayarak parametreleri artırmaya dayanıyor, kötü niyetli kullanıcıları hiç düşünmemişler.
View OriginalReply0
SorryRugPulled
· 7h ago
grok被玩坏了哈哈,这就是为什么我不信任ai的原因,太容易被骗
Reply0
NotGonnaMakeIt
· 7h ago
grok yine yanlış kullanıldı, bu ne kadar düşük zekalı bir şey ha ha
prompt injection bu şey gerçekten engellenemez, yapay zekanın beyni hâlâ çok saf
söyleyin bakalım, boş boş bu açıkları zorlayan kim oluyor...
Bu günlerde güvenlik sorunlarının hep sonradan fark edildiğini hissediyorum
Yapay zekanın gelecek yıl daha kolay kandırılabilir olup olmayacağından endişeleniyorum
View OriginalReply0
ImpermanentTherapist
· 7h ago
grok yine başarısız oldu, işte bu yüzden bu modellere hala güvenmiyorum... çok kolay bir şekilde poke edilebiliyor.
View OriginalReply0
ForkYouPayMe
· 7h ago
Haha yine bir prompt injection senaryosu, Grok'un bu savunma gücü gerçekten dayanamaz hale geldi
---
Yani AI modelleri böyle mi bozuyorlar? Aslında düşündüğüm kadar zeki değiller gibi geliyor
---
İşte bu yüzden bu büyük modellere pek güvenmiyorum, birkaç cümleyle onları saçmalık içerikler üretmeye ikna edebiliyorlar
---
Prompt injection bu konuda uzun süredir araştırılıyor, Grok hâlâ başarısız oluyor, gülmekten öldüm
---
Gerçekten, bu AI şirketleri sadece hava atıyor, güvenlik önlemleri hiç bir zaman yetişmedi
View OriginalReply0
TokenomicsTinfoilHat
· 7h ago
grok jailbreak mi oldu? Ha, çoktan gelmesi gereken bir şeydi, her modelin bir zayıf noktası var.
---
prompt injection bu tuzağı oynanmaya devam edilmeli, ai güvenlik duvarı kesinlikle işe yaramıyor.
---
Bir başka "ileri" modelin başarısızlığı, bu neyi gösteriyor... Güvenlik konusunda daha fazla çaba sarf edilmeli.
---
İlginç olan, bu şirketlerin her seferinde kendilerinin su geçirmez savunması olduğunu söylemeleri, sonuçta... Bir dokunuşla kırılıyor.
---
Bu gerçek bir ai güvenlik sorunu, ne doomsday teorileri kadar gerçekçi.
---
grok da bir istisna değil, adversarial prompt karşısında hepsi kağıt kaplan.
View OriginalReply0
mev_me_maybe
· 7h ago
grok yine kötüye kullanıldı, bu yüzden bu modelleri asla tamamen güvenmiyorum
prompt enjeksiyonu bu kadar kolay olması... yapay zeka güvenliğinin gerçekten bir şaka olduğunu gösteriyor
İnsanlar çok zeki lol, modelin savunma hattı kağıt gibi ince
Bugün Grok ile ilginç bir şey oldu. Birisi, düşmanca istemlerle sistemi manipüle etmeyi başardı ve aniden belirli bireyler hakkında son derece övücü şeyler söylemeye başladı.
Klasik bir prompt enjeksiyon güvenlik açığı vakası. Bu AI modelleri hala kötü niyetli girişimleri ele almayı öğreniyor ve doğru tuşlara basıldığında çıktıları manipüle etmenin ne kadar kolay olduğunu gösteriyor. Tüm bu olay, AI güvenliği ile ilgili daha büyük bir sorunu öne çıkarıyor—bu sistemler, doğru ( veya yanlış ) istemlerle beklenmedik yönlere yönlendirilebilir.
Bu, gelişmiş modellerin bile kör noktalarının olduğunu hatırlatıyor. Savunma mekanizmalarının ciddi güncellemelere ihtiyacı var.