Issei Sato

Cette étude montre l'efficacité des Transformers à une couche dans la mémorisation des données.

2025-10-15T17:22:42+00:00 ― 8 min lire

Un aperçu des méthodes efficaces pour peaufiner les modèles de langage.

2025-08-06T23:30:00+00:00 ― 8 min lire

Cette étude analyse à quel point les Transformers peuvent mémoriser des données dans différents contextes.

2025-06-04T19:05:42+00:00 ― 14 min lire

Cette étude parle d'améliorer la précision des modèles pour les données à longue traîne en utilisant l'ajustement logit.

2025-06-04T16:27:42+00:00 ― 9 min lire

Apprends comment les modèles de langage utilisent l'apprentissage en contexte et font face à des défis.

2025-02-27T20:41:33+00:00 ― 7 min lire