Arthur Conmy

Cette étude utilise des autoencodeurs épars pour interpréter les sorties de la couche d'attention dans les transformers.

2025-07-24T13:50:18+00:00 ― 7 min lire

Les JumpReLU SAEs améliorent la représentation des données tout en restant simples et clairs.

2025-07-10T09:44:36+00:00 ― 8 min lire

Gemma Scope propose des outils pour mieux comprendre les modèles de langage et améliorer la sécurité de l'IA.

2025-06-30T01:33:06+00:00 ― 8 min lire

Une méthode pour améliorer l’efficacité du vecteur de direction dans les modèles linguistiques.

2025-05-31T10:57:27+00:00 ― 6 min lire