L'examen des attaques de jailbreak montre des faiblesses dans la sécurité des modèles de langage.
― 6 min lire
La science de pointe expliquée simplement
L'examen des attaques de jailbreak montre des faiblesses dans la sécurité des modèles de langage.
― 6 min lire
Un nouveau cadre évalue l'efficacité des classificateurs de sécurité des images contre le contenu nocif.
― 13 min lire