Une étude révèle de nouvelles techniques pour des attaques par porte dérobée sur des modèles de langage avec un impact minimal.
― 13 min lire
La science de pointe expliquée simplement
Une étude révèle de nouvelles techniques pour des attaques par porte dérobée sur des modèles de langage avec un impact minimal.
― 13 min lire
Cette approche améliore l’efficacité de l’entraînement des modèles à partir de grandes données graphiques tout en protégeant la vie privée.
― 7 min lire
Une nouvelle méthode pour protéger les droits individuels contre l'utilisation abusive d'images dans les animations.
― 7 min lire
Un nouveau cadre vise à révéler les biais dans les scénarios de jeu de rôle des modèles de langage.
― 9 min lire
Une base de données pour lutter contre les défauts de backdoor dans les modèles d'apprentissage profond.
― 13 min lire