Xupeng Miao

Présentation d'une nouvelle méthode pour réduire l'utilisation de la mémoire lors du finetuning de gros modèles.

2025-09-17T08:00:12+00:00 ― 7 min lire

Une méthode double pour entraîner et utiliser les modèles de langage de manière efficace.

2025-09-03T10:05:48+00:00 ― 8 min lire

Un nouveau système améliore le service des grands modèles de langage sur différentes configurations de GPU.

2025-08-03T04:39:00+00:00 ― 7 min lire

Un nouvel optimiseur améliore l'efficacité dans l'exécution des réseaux de neurones profonds sur des GPU.

2025-07-29T12:36:06+00:00 ― 6 min lire

Une nouvelle méthode améliore l'efficacité de l'entraînement des DNN et réduit l'utilisation de la mémoire.

2025-07-25T01:33:24+00:00 ― 7 min lire

Des méthodes innovantes améliorent les simulations de circuits quantiques, en surmontant les limites matérielles.

2025-06-23T03:28:54+00:00 ― 6 min lire

Découvrez comment le microserving LLM améliore l'efficacité et la flexibilité dans les applications d'IA.

2025-03-04T20:15:54+00:00 ― 9 min lire