La recherche met en avant des méthodes pour détecter des attaques par porte dérobée lors du fine-tuning des modèles de langage.
Zhen Sun, Tianshuo Cong, Yule Liu
― 12 min lire
La science de pointe expliquée simplement
La recherche met en avant des méthodes pour détecter des attaques par porte dérobée lors du fine-tuning des modèles de langage.
Zhen Sun, Tianshuo Cong, Yule Liu
― 12 min lire
Les chercheurs s'attaquent à l'hallucination d'objets dans l'IA pour améliorer la précision et la fiabilité.
Le Yang, Ziwei Zheng, Boxu Chen
― 8 min lire