ProSparse améliore la sparsité d'activation dans les LLM pour une meilleure efficacité et performance.
― 9 min lire
La science de pointe expliquée simplement
ProSparse améliore la sparsité d'activation dans les LLM pour une meilleure efficacité et performance.
― 9 min lire
Examiner le grokking, la double descente et les capacités émergentes dans les modèles d'apprentissage profond.
― 8 min lire
Examiner comment les LLM peuvent additionner des chiffres sans étapes explicites.
― 7 min lire
MiniCPM-V améliore l'utilisation de l'IA sur les appareils mobiles avec efficacité et performances.
― 7 min lire
Une nouvelle méthode combine des modèles autoregressifs et de diffusion pour une meilleure génération de médias.
― 9 min lire