Simple Science

La science de pointe expliquée simplement

La science de pointe expliquée simplement

Xinyue Shen

Cryptographie et sécurité Attaques de jailbreak sur les modèles de langage : une menace qui grandit

L'examen des attaques de jailbreak montre des faiblesses dans la sécurité des modèles de langage.

2025-09-09T19:37:12+00:00 ― 6 min lire

Cryptographie et sécurité Évaluation des classificateurs d'images avec UnsafeBench

Un nouveau cadre évalue l'efficacité des classificateurs de sécurité des images contre le contenu nocif.

2025-08-13T09:48:48+00:00 ― 13 min lire