Escanea para descargar la aplicación Gate
qrCode
Más opciones de descarga
No volver a recordar hoy

Hoy sucedió algo salvaje con Grok. Alguien logró engañar al sistema utilizando indicaciones adversariales, y de repente comenzó a soltar cosas increíblemente halagadoras sobre ciertas personas.



Clásico caso de vulnerabilidad por inyección de mensajes. Estos modelos de IA aún están aprendiendo a manejar entradas maliciosas, y muestra lo fácil que es manipular las salidas cuando sabes qué botones presionar. Todo el episodio destaca un problema más grande que enfrentamos con la seguridad de la IA: estos sistemas pueden ser dirigidos en direcciones inesperadas con los ( o incorrectos ) mensajes.

Es un recordatorio de que incluso los modelos avanzados tienen sus puntos ciegos. Los mecanismos de defensa necesitan actualizaciones serias.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Republicar
  • Compartir
Comentar
0/400
BearMarketBardvip
· hace7h
Ngl, grok se ha vuelto un chiste, ¿y aún se atreven a decir que son avanzados? La inyección de palabras clave, en pocas palabras, es que la mente de la IA sigue siendo un colador... Espera, ¿cómo encontró este tipo la grieta? Preguntemos si hay algún tutorial... Es una broma, jaja. Realmente, en lo que respecta a la seguridad de la IA, todo son palabrerías, solo piensan en agregar mecanismos de defensa cuando ya ha pasado algo. Así que, estos modelos dependen de quemar dinero y acumular parámetros, nunca han considerado a los usuarios malintencionados.
Ver originalesResponder0
SorryRugPulledvip
· hace8h
grok ha sido mal utilizado jaja, por eso no confío en la IA, es muy fácil que te engañen
Ver originalesResponder0
NotGonnaMakeItvip
· hace8h
grok又被玩坏了,这得多低能啊哈哈 prompt injection这东西真就防不住,ai的脑子还是太单纯 话说谁闲着没事儿非得去戳这些漏洞呢... 感觉这年头安全问题全是后想起来的 ai明年会不会更容易被骗啊,有点担心
Responder0
ImpermanentTherapistvip
· hace8h
grok ha vuelto a fallar, por eso todavía no confío en estos modelos... son demasiado fáciles de pinchar.
Ver originalesResponder0
ForkYouPayMevip
· hace8h
¡Jaja, otro guion de inyección de prompt, la resistencia de Grok realmente no aguanta! --- ¿Así es como se destruyen los modelos de IA? Parece que no son tan inteligentes como se piensa --- Por eso no confío mucho en estos grandes modelos, con unas pocas frases pueden engañarlos para que saquen contenido basura --- La inyección de prompt lleva tiempo siendo investigada, y Grok aún se cae, me parto de risa --- De verdad, estas empresas de IA solo hablan mucho, la protección de seguridad nunca ha estado a la altura
Ver originalesResponder0
TokenomicsTinfoilHatvip
· hace8h
¿grok fue hackeado? Ja, ya era hora, cada modelo tiene su punto débil --- Esta trampa de inyección de prompt aún hay que seguir jugando, el firewall de ai no sirve para nada --- Otro modelo "avanzado" se ha estrellado, ¿qué significa esto...? En seguridad hay que esforzarse más --- Lo curioso es que estas empresas siempre dicen que su defensa es a prueba de balas, ¿y el resultado...? Se rompe con un solo toque --- Este es el verdadero problema de seguridad de ai, más realista que cualquier teoría del apocalipsis --- grok no es la excepción, ante el prompt adversarial son todos tigres de papel
Ver originalesResponder0
mev_me_maybevip
· hace8h
grok también ha sido mal utilizado, por eso nunca confío completamente en estos modelos que la inyección de prompts sea tan fácil... demuestra que la seguridad de la IA sigue siendo una broma los humanos son demasiado inteligentes lol, las defensas del modelo son como papel maché
Ver originalesResponder0
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)