El examen de ataques de jailbreak muestra debilidades en la seguridad de los modelos de lenguaje.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
El examen de ataques de jailbreak muestra debilidades en la seguridad de los modelos de lenguaje.
― 6 minilectura
Un nuevo marco evalúa la efectividad de los clasificadores de seguridad de imágenes contra contenido dañino.
― 13 minilectura