Difan Zou

La recherche se concentre sur l'amélioration de l'efficacité de l'entraînement dans des graphes dynamiques.

2025-09-11T11:07:12+00:00 ― 8 min lire

Explorer des méthodes pour améliorer l'apprentissage automatique dans des environnements de graphes dynamiques.

2025-09-05T23:43:00+00:00 ― 9 min lire

Cette étude examine comment le préconditionnement peut améliorer la performance du SGD par rapport à la régression ridge.

2025-08-29T19:14:00+00:00 ― 10 min lire

Cette étude examine comment la profondeur des transformateurs affecte les tâches d'apprentissage.

2025-08-23T19:43:00+00:00 ― 6 min lire

Nouveau cadre améliore la planification de voyage pour les grands modèles de langage.

2025-08-05T18:47:48+00:00 ― 6 min lire

Enquête sur comment de petites erreurs dans les données d'entraînement améliorent le contenu généré par l'IA.

2025-08-04T09:29:06+00:00 ― 6 min lire

Approche innovante pour guider les grands modèles de langage grâce à l'auto-évaluation.

2025-08-02T15:05:18+00:00 ― 5 min lire

Cette étude explore comment les transformers apprennent grâce à l'attention multi-tête dans les tâches de régression.

2025-06-30T11:25:36+00:00 ― 8 min lire

Examiner l'impact de la réduction du taux sparse sur la performance des modèles Transformer.

2025-05-05T16:12:00+00:00 ― 7 min lire

Découvre comment la génération parallélisée transforme la production d'images et de vidéos.

2025-02-13T07:36:18+00:00 ― 7 min lire