Ruoyu Sun

AceGPT améliore le traitement de la langue arabe adapté à la culture et aux valeurs locales.

2025-09-23T18:42:42+00:00 ― 6 min lire

Cet article explore les défis d'optimisation dans les Transformers et l'efficacité d'Adam par rapport à SGD.

2025-09-03T21:48:54+00:00 ― 7 min lire

Adam-mini réduit l'utilisation de la mémoire pour entraîner de grands modèles de langage tout en gardant de bonnes performances.

2025-07-24T23:19:06+00:00 ― 7 min lire

Une nouvelle approche pour résoudre efficacement des problèmes de programmation linéaire à grande échelle.

2025-07-20T19:42:52+00:00 ― 6 min lire

MoFO aide les grands modèles de langage à garder leur savoir pendant le fine-tuning sans perdre en performance.

2025-07-05T01:30:00+00:00 ― 6 min lire

Une nouvelle approche améliore les réponses des modèles de langage et réduit le surapprentissage.

2025-06-20T07:19:00+00:00 ― 8 min lire

Découvrez comment PDQP-Net accélère la résolution des programmes quadratiques convexes.

2025-04-15T23:07:10+00:00 ― 7 min lire