El ataque de crescendo usa conversaciones amistosas para manipular modelos de IA y que den resultados dañinos.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
El ataque de crescendo usa conversaciones amistosas para manipular modelos de IA y que den resultados dañinos.
― 5 minilectura
La competencia revela vulnerabilidades y defensas en la seguridad de los modelos de lenguaje.
― 4 minilectura
Un nuevo enfoque para probar la propiedad de los modelos de lenguaje.
― 5 minilectura
Examinando las amenazas que plantean los agentes de modelos de lenguaje autónomos y sus debilidades.
― 7 minilectura