Ahmed Salem

L'attaque crescendo utilise des conversations amicales pour manipuler les modèles d'IA et les amener à produire des résultats nuisibles.

2025-08-23T05:14:00+00:00 ― 6 min lire

La compétition révèle des vulnérabilités et des défenses dans la sécurité des modèles linguistiques.

2025-07-29T17:12:36+00:00 ― 4 min lire

Une nouvelle approche pour prouver la propriété des modèles de langage.

2025-07-13T08:42:42+00:00 ― 6 min lire

Examiner les menaces posées par les agents de modèle de langage autonomes et leurs faiblesses.

2025-07-04T23:55:12+00:00 ― 8 min lire