Simple Science

Ciencia de vanguardia explicada de forma sencilla

Ciencia de vanguardia explicada de forma sencilla

Xinyue Shen

Criptografía y seguridad Ataques de Jailbreak a Modelos de Lenguaje: Una Amenaza Creciente

El examen de ataques de jailbreak muestra debilidades en la seguridad de los modelos de lenguaje.

2025-09-09T19:37:12+00:00 ― 6 minilectura

Criptografía y seguridad Evaluando clasificadores de seguridad de imágenes con UnsafeBench

Un nuevo marco evalúa la efectividad de los clasificadores de seguridad de imágenes contra contenido dañino.

2025-08-13T09:48:48+00:00 ― 13 minilectura