Zhao Song

Optimisation et contrôle Avancées dans les algorithmes SVM : Une nouvelle approche

De nouvelles techniques visent à accélérer considérablement les performances des machines à vecteurs de support.

2025-10-12T15:17:12+00:00 ― 6 min lire

Apprentissage automatique Le rôle du Softmax dans les modèles de langage

Explorer l'impact de softmax sur l'entraînement des grands modèles de langage et les avancées récentes.

2025-10-12T00:16:00+00:00 ― 8 min lire

Physique quantique Avancées quantiques dans le calcul d'attention pour les modèles de langue

Une nouvelle approche quantique accélère les calculs d'attention dans les modèles de langage.

2025-10-11T20:26:42+00:00 ― 6 min lire

Apprentissage automatique Améliorer l'efficacité des mécanismes d'attention

Cet article aborde le problème de la régression par noyau d'attention et propose des solutions efficaces.

2025-10-03T19:16:00+00:00 ― 5 min lire

Apprentissage automatique Régression Softmax-ReLU dans les modèles de langage

Un aperçu plus détaillé de la régression softmax-ReLU et de son impact sur les modèles de langage.

2025-10-03T03:29:00+00:00 ― 7 min lire

Apprentissage automatique Avancées dans les techniques de distance de Mahalanobis

Un aperçu de la distance de Mahalanobis et des approches innovantes pour l'analyse de données.

2025-10-01T12:13:48+00:00 ― 6 min lire

Apprentissage automatique Optimiser la prise de décision dans des contextes avec des ressources limitées

Une méthode pour équilibrer les récompenses et les ressources en utilisant des bandits contextuels regroupés.

2025-10-01T08:55:36+00:00 ― 8 min lire

Apprentissage automatique Le passage vers des modèles de langage décentralisés

Explorer la montée des modèles de langue décentralisés et leurs avantages par rapport aux systèmes centralisés.

2025-10-01T03:55:12+00:00 ― 11 min lire

Structures de données et algorithmes Rendre la programmation semi-défini plus efficace pour les gros volumes de données

Des méthodes innovantes réduisent l'utilisation de la mémoire dans la programmation semi-définie pour les données en streaming.

2025-09-28T15:53:42+00:00 ― 6 min lire

Apprentissage automatique Comprendre les Réseaux de Neurones Graphiques et GNTK

Un aperçu de la relation entre les Réseaux de Neurones Graphiques et le Noyau Tangent Graphique.

2025-09-26T15:34:24+00:00 ― 7 min lire

Structures de données et algorithmes Le Rôle de l'Attention dans les Modèles de Langage

Découvrez comment l'attention façonne les modèles linguistiques et leurs applications dans la technologie.

2025-09-22T17:59:04+00:00 ― 10 min lire

Apprentissage automatique Optimiser le calcul en arrière dans les modèles de langue

Cette recherche examine l'efficacité du calcul en arrière dans l'entraînement des modèles de langue.

2025-09-10T21:17:42+00:00 ― 7 min lire

Apprentissage automatique Modèles de langage large et raisonnement mathématique

Examinant la capacité des LLMs à résoudre des problèmes mathématiques, surtout l'arithmétique modulaire.

2025-09-01T14:38:32+00:00 ― 10 min lire

Apprentissage automatique Améliorer l'efficacité avec l'attention sparse dans les LLMs

Découvrez comment l'attention éparse améliore le traitement dans les modèles de langage.

2025-08-22T21:04:12+00:00 ― 7 min lire

Apprentissage automatique Inverser les scores de levier dans les modèles d'apprentissage automatique

Explorer des méthodes pour récupérer les paramètres du modèle à partir des scores de levier dans l'analyse de régression.

2025-08-17T20:43:36+00:00 ― 7 min lire

Apprentissage automatique Le rôle du Softmax dans les réseaux de neurones

Explorer l'importance de softmax dans la performance et les applications des réseaux de neurones.

2025-08-13T07:02:54+00:00 ― 5 min lire

Apprentissage automatique Améliorer l'efficacité de l'attention dans les Transformers

Une nouvelle méthode améliore les mécanismes d'attention dans les modèles linguistiques pour de meilleures performances.

2025-08-12T17:05:30+00:00 ― 7 min lire

Apprentissage automatique Comprendre les modèles de diffusion en apprentissage automatique

Explorer les bases et les applications des modèles de diffusion dans différents domaines.

2025-08-07T06:52:24+00:00 ― 7 min lire

Apprentissage automatique Avancées dans les mécanismes d'attention tensorielle

Explorer l'attention tensorielle et son impact sur le traitement des données dans les modèles d'IA.

2025-08-07T06:44:30+00:00 ― 5 min lire

Apprentissage automatique Améliorer les modèles de langage avec l'apprentissage de préfixe et l'attention NTK

Avancées dans le fine-tuning des modèles de langage avec des techniques innovantes.

2025-07-26T01:47:00+00:00 ― 8 min lire

Apprentissage automatique Ajustement efficace avec adaptation à faible rang

Explore les avantages et les applications de l'adaptation de faible rang dans les modèles d'IA.

2025-07-18T23:12:56+00:00 ― 9 min lire

Apprentissage automatique Équilibrer la vie privée et la performance dans les systèmes d'IA

Examiner la confidentialité différentielle et la régression NTK pour protéger les données des utilisateurs dans l'IA.

2025-07-11T01:56:18+00:00 ― 9 min lire

Apprentissage automatique Protéger la vie privée dans les mécanismes de cross-attention de l'IA

Explorer la confidentialité différentielle pour protéger les infos sensibles dans les applis IA.

2025-07-10T14:21:06+00:00 ― 7 min lire

Apprentissage automatique Examen de l'efficacité des transformateurs de diffusion latente

Cet article passe en revue les capacités et les limites des transformateurs de diffusion latente.

2025-07-07T01:00:04+00:00 ― 7 min lire

Structures de données et algorithmes Combiner la confidentialité différentielle avec le calcul des ellipsoïdes de John

Une nouvelle méthode améliore le calcul des ellipsoïdes de John tout en protégeant les données sensibles.

2025-06-29T13:26:18+00:00 ― 10 min lire

Apprentissage automatique Comprendre les scores de levier et leur impact

Explore l'importance des scores de levier dans l'analyse de données et la vie privée.

2025-06-25T10:33:24+00:00 ― 9 min lire

Structures de données et algorithmes Améliorer l'efficacité des grands modèles de langage

SparseGPT améliore la vitesse et l'efficacité des grands modèles de langage grâce à l'élagage des paramètres.

2025-06-23T13:23:42+00:00 ― 5 min lire

Apprentissage automatique Une méthode innovante réduit le temps de calcul des gradients pour les transformers

Une nouvelle méthode améliore les calculs de gradient, rendant les transformeurs plus efficaces en apprentissage automatique.

2025-06-23T07:28:12+00:00 ― 5 min lire

Structures de données et algorithmes Calculs plus rapides pour l'ellipsoïde de John

De nouveaux algorithmes combinent l'informatique quantique et les méthodes classiques pour accélérer les calculs.

2025-06-21T18:36:12+00:00 ― 5 min lire

Structures de données et algorithmes Protéger la vie privée avec du KDE différemment privé

Découvre comment la vie privée différentielle améliore l'analyse de données tout en protégeant les infos perso.

2025-06-10T12:19:12+00:00 ― 7 min lire

Apprentissage automatique Réseaux de neurones 1-bit : Une nouvelle approche

Les modèles 1-bit montrent un gros potentiel en termes d'efficacité et de performance dans l'apprentissage machine.

2025-06-01T02:36:54+00:00 ― 7 min lire

Apprentissage automatique Transformers dans le traitement du langage : limites et potentiel

Explorer les capacités et les défis de la technologie des Transformers pour comprendre le langage.

2025-05-24T19:18:45+00:00 ― 7 min lire

Structures de données et algorithmes Protéger la vie privée dans l'analyse de données avec des distances de chaînes

Apprends comment les distances de chaînes peuvent aider à protéger la vie privée dans l'analyse de données sensibles.

2025-05-16T15:59:34+00:00 ― 7 min lire

Complexité informatique Débloquer les secrets des réseaux de Hopfield modernes

Un coup d'œil sur comment les MHNs peuvent améliorer l'apprentissage automatique.

2025-04-03T15:17:33+00:00 ― 7 min lire

Complexité informatique Mamba vs. Modèles d'Espace d'État : Le Duel de l'IA

Un aperçu de Mamba et des modèles d'état-espace dans les capacités de l'IA.

2025-04-02T21:38:15+00:00 ― 8 min lire

Apprentissage automatique Équité dans les données : Une approche équilibrée

Explorer des méthodes pour un apprentissage machine équitable grâce à l'approximation de rang faible et à la sélection de sous-ensembles.

2025-03-16T08:35:03+00:00 ― 6 min lire

Apprentissage automatique LazyDiT : Accélérer la génération d'images

LazyDiT propose une façon plus intelligente de créer des images plus rapidement sans perdre en qualité.

2025-03-04T12:14:24+00:00 ― 6 min lire

Apprentissage automatique Élaguer les Transformers : Réduire le volume sans sacrifier la qualité

Des techniques de taille innovantes rendent les modèles d'IA plus efficaces et performants.

2025-03-04T11:26:15+00:00 ― 8 min lire

Apprentissage automatique Grams : Une nouvelle façon d'optimiser l'apprentissage machine

Grams propose une nouvelle approche pour optimiser les modèles d'apprentissage automatique.

2025-02-07T19:28:00+00:00 ― 8 min lire

Apprentissage automatique L'avenir de l'IA : Explication de l'attention tensorielle

Découvrez comment l'attention tensorielle transforme le traitement du langage par l'IA.

2025-02-01T10:43:03+00:00 ― 8 min lire

Apprentissage automatique Suivi rapide de l'IA : Mécanismes d'attention RoPE

De nouvelles méthodes améliorent l'attention RoPE, accélérant considérablement les calculs d'IA.

2025-01-29T08:53:15+00:00 ― 7 min lire