Gabriele Oliaro

Présentation d'une nouvelle méthode pour réduire l'utilisation de la mémoire lors du finetuning de gros modèles.

Sep 17, 2025 ― 7 min lire

Une méthode double pour entraîner et utiliser les modèles de langage de manière efficace.

Sep 3, 2025 ― 8 min lire

Un nouvel optimiseur améliore l'efficacité dans l'exécution des réseaux de neurones profonds sur des GPU.

Jul 29, 2025 ― 6 min lire

Un aperçu de SuffixDecoding et son impact sur l'efficacité des modèles linguistiques.

May 28, 2025 ― 6 min lire