Zhongzhi Yu

Explorer comment les puits d'attention impactent la performance des modèles de langage et introduire une technique d'étalonnage.

2025-07-25T11:02:12+00:00 ― 7 min lire

Un nouveau cadre améliore la façon dont les grands modèles de langage peuvent fonctionner sur des appareils edge.

2025-07-25T10:54:18+00:00 ― 9 min lire

KVMerger réduit l'utilisation de mémoire dans les modèles linguistiques tout en maintenant la performance grâce à un bon mélange des états.

2025-07-15T02:19:06+00:00 ― 7 min lire

Un nouveau système améliore l'adaptabilité des grands modèles de langage sur différents appareils.

2025-05-22T21:38:15+00:00 ― 6 min lire