Ashwath Aithal

La famille Nemotron-4 340B propose des modèles puissants pour des applications diverses et la génération de données synthétiques.

2025-07-27T18:43:54+00:00 ― 10 min lire

Une méthode pour réduire les modèles de langage sans perdre en efficacité grâce à l'élagage et à la distillation.

2025-06-24T13:29:24+00:00 ― 6 min lire

Découvrez comment le Mixture-of-Experts rend l'entraînement des modèles d'IA plus efficace et moins cher.

2025-03-10T08:40:39+00:00 ― 7 min lire