Zhen Sun

Examina varios ataques de jailbreak en modelos de lenguaje y sus defensas.

2025-07-18T11:09:42+00:00 ― 8 minilectura

IMOST mejora la capacidad de los robots para aprender sobre caminos transitables mientras navegan por entornos complejos.

2025-06-08T08:17:00+00:00 ― 7 minilectura

La investigación destaca métodos para detectar ataques de puerta trasera en el ajuste fino de modelos de lenguaje.

2025-05-06T10:46:40+00:00 ― 10 minilectura

Los métodos innovadores buscan mejorar los modelos de lenguaje de IA, asegurando al mismo tiempo seguridad y eficiencia.

2025-04-30T12:54:40+00:00 ― 7 minilectura