Rio Yokota

Une nouvelle méthode montre que l'apprentissage variationnel peut exceller dans la formation de modèles complexes.

2025-08-25T22:25:44+00:00 ― 6 min lire

Un corpus japonais solide créé à partir de données de Common Crawl améliore la performance des LLM.

2025-08-16T05:53:06+00:00 ― 9 min lire

Améliorer les modèles de langue japonaise avec des connaissances en anglais booste grave les performances.

2025-08-15T22:22:48+00:00 ― 8 min lire

Explore des méthodes d'apprentissage locales qui transforment l'entraînement des réseaux de neurones.

2025-05-31T05:57:18+00:00 ― 8 min lire

Des chercheurs développent des méthodes pour apprendre aux ordinateurs à traiter des factures tout en protégeant la vie privée.

2025-05-29T04:34:57+00:00 ― 7 min lire

Un guide pour accélérer l'entraînement des grands modèles de langage avec parallélisme et gestion de la mémoire.

2025-05-26T13:04:21+00:00 ― 7 min lire

Un aperçu de comment IVON améliore efficacement la performance des modèles d'IA.

2025-05-19T00:10:25+00:00 ― 6 min lire

SuperGCN améliore l'efficacité de l'entraînement pour les grands graphes en utilisant des techniques avancées de CPU.

2025-05-10T16:57:20+00:00 ― 8 min lire

Apprends à réduire les frais de communication dans les modèles d'apprentissage profond pour améliorer la vitesse d'entraînement.

2025-05-08T16:49:20+00:00 ― 8 min lire

Explorer l'importance de développer des grands modèles linguistiques dans les langues locales.

2025-02-21T00:58:57+00:00 ― 7 min lire