Ahmed Salem

El ataque de crescendo usa conversaciones amistosas para manipular modelos de IA y que den resultados dañinos.

2025-08-23T05:14:00+00:00 ― 5 minilectura

La competencia revela vulnerabilidades y defensas en la seguridad de los modelos de lenguaje.

2025-07-29T17:12:36+00:00 ― 4 minilectura

Un nuevo enfoque para probar la propiedad de los modelos de lenguaje.

2025-07-13T08:42:42+00:00 ― 5 minilectura

Examinando las amenazas que plantean los agentes de modelos de lenguaje autónomos y sus debilidades.

2025-07-04T23:55:12+00:00 ― 7 minilectura