Yule Liu

Examinez les différentes attaques de jailbreak sur les modèles de langage et leurs défenses.

2025-07-18T11:09:42+00:00 ― 9 min lire

La recherche met en avant des méthodes pour détecter des attaques par porte dérobée lors du fine-tuning des modèles de langage.

2025-05-06T10:46:40+00:00 ― 12 min lire

Des méthodes innovantes visent à améliorer les modèles de langage IA tout en garantissant sécurité et efficacité.

2025-04-30T12:54:40+00:00 ― 7 min lire