Yingyan Celine Lin

Recherche sur l'amélioration de l'efficacité des modèles de langage en utilisant une attention linéaire et un décodage spéculatif.

2025-07-30T11:38:36+00:00 ― 9 min lire

Explorer comment les puits d'attention impactent la performance des modèles de langage et introduire une technique d'étalonnage.

2025-07-25T11:02:12+00:00 ― 7 min lire

Un nouveau cadre améliore la façon dont les grands modèles de langage peuvent fonctionner sur des appareils edge.

2025-07-25T10:54:18+00:00 ― 9 min lire

Un nouveau système améliore l'adaptabilité des grands modèles de langage sur différents appareils.

2025-05-22T21:38:15+00:00 ― 6 min lire