Derniers articles pour Évaluation du modèle

Vision par ordinateur et reconnaissance des formes Repenser les méthodes d'évaluation pour les modèles multimodaux

Nouveau repère améliore l'évaluation des modèles multimodaux en minimisant les biais.

2025-07-22T12:12:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'apprentissage multimodal dans les modèles de langue

Cette étude examine comment les données visuelles et textuelles influencent la performance des modèles.

2025-07-22T07:03:54+00:00 ― 9 min lire

Intelligence artificielle Décomposition Contextuelle : Une Nouvelle Perspective pour les Transformers

CD-T améliore la compréhension des modèles de transformateur, renforçant l'interprétation et la confiance.

2025-07-22T06:40:12+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Mesurer le biais de genre dans les grands modèles de vision-langage

Un nouveau référentiel évalue le biais de genre dans les modèles d'IA liés aux postes de travail.

2025-07-22T01:40:00+00:00 ― 7 min lire

Apprentissage automatique S'attaquer aux attaques par backdoor en mode clean-label dans l'apprentissage automatique

Examiner les vulnérabilités des attaques par backdoor clean-label et comment les bornes de généralisation peuvent aider.

2025-07-21T22:58:40+00:00 ― 8 min lire

Multimédia OpenVNA : Faire avancer la compréhension des langues dans le bruit

Un nouvel outil pour tester les modèles de langue dans des environnements bruyants.

2025-07-21T05:23:24+00:00 ― 5 min lire

Apprentissage automatique Réévaluation des évaluations des modèles de machine learning pour les données tabulaires

Une nouvelle approche pour évaluer les modèles de ML en se concentrant sur la préparation des données.

2025-07-20T15:49:42+00:00 ― 11 min lire

Apprentissage automatique Évaluation des méthodes d'IA explicable pour la fiabilité

La recherche évalue la stabilité des méthodes XAI en utilisant un ensemble de données sur le diabète.

2025-07-20T07:08:18+00:00 ― 8 min lire

Génie logiciel Évaluer les grands modèles de langage dans des contextes de codage

Une étude sur comment les LLM gèrent les règles et contraintes de codage.

2025-07-19T18:29:54+00:00 ― 5 min lire

Calcul et langage Évaluation des grands modèles de langage : points clés

Découvre l'importance et les défis d'évaluer efficacement la performance des LLM.

2025-07-19T12:26:30+00:00 ― 7 min lire

Génie logiciel Évaluation des modèles de base : défis et solutions

Un aperçu des classements des modèles de fondation et de leurs problèmes d'évaluation.

2025-07-19T12:10:42+00:00 ― 9 min lire

Apprentissage automatique Réévaluer les modèles génératifs grâce à de nouvelles métriques

De nouvelles métriques offrent une meilleure évaluation de la performance des modèles génératifs en apprentissage automatique.

2025-07-19T03:21:24+00:00 ― 6 min lire

Apprentissage automatique Comprendre l'effet Rashomon en apprentissage automatique

L'effet Rashomon montre plusieurs modèles efficaces en apprentissage automatique.

2025-07-18T20:46:24+00:00 ― 10 min lire

Méthodologie Évaluation des résultats temps-événement : une critique importante

Une revue des méthodes pour évaluer les prédictions de temps jusqu'à l'événement en science des données.

2025-07-18T17:22:28+00:00 ― 9 min lire

Apprentissage automatique Le Rôle de l'Invariance dans l'Apprentissage par Transfert

Examiner comment l'invariance affecte la performance des modèles en apprentissage par transfert.

2025-07-18T11:33:24+00:00 ― 7 min lire

Calcul et langage Évaluer l'impact de la post-formation sur les modèles de langue

Analyser les vrais effets des méthodes post-formation sur la performance des modèles de langue.

2025-07-18T04:50:30+00:00 ― 7 min lire

Apprentissage automatique Défis dans les modèles de classification unidimensionnelle légers

Examiner les vulnérabilités des modèles légers face aux attaques adversariales.

2025-07-17T15:24:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer à l'hallucination d'objets dans les modèles vision-langage

Cette étude évalue comment les grands modèles gèrent plusieurs objets dans les images.

2025-07-17T12:30:54+00:00 ― 8 min lire

Apprentissage automatique Évaluation des avancées dans l'adaptation de domaine de graphes non supervisée

Un aperçu des défis et des innovations dans les méthodes d'adaptation de domaine pour les graphes.

2025-07-16T23:13:00+00:00 ― 10 min lire

Apprentissage automatique Améliorer la fiabilité du modèle grâce à l'analyse de calibration

Cette recherche améliore la fiabilité des modèles de machine learning grâce à des techniques de calibration et de recalibration.

2025-07-16T19:28:48+00:00 ― 11 min lire

Apprentissage automatique Défis dans le traitement de longues séquences de données

Examiner les difficultés que rencontrent les modèles avec de longues séquences dans différentes applications.

2025-07-16T04:15:24+00:00 ― 7 min lire

Apprentissage automatique Gérer le hasard dans les modèles de deep learning

Apprends comment la sélection aléatoire de graines influence la performance et la fiabilité des modèles d'IA.

2025-07-15T19:16:52+00:00 ― 7 min lire

Calcul et langage Repenser les méthodes d'évaluation pour les LLMs

Une nouvelle approche pour évaluer les grands modèles de langage afin d'obtenir de meilleures idées sur leurs performances.

2025-07-15T16:32:18+00:00 ― 6 min lire

Apprentissage automatique HO-FMN : Une nouvelle approche pour les attaques adversariales

Présentation de HO-FMN pour une meilleure évaluation de la robustesse des modèles d'apprentissage automatique face aux attaques adversariales.

2025-07-15T08:54:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Réévaluer les vulnérabilités dans les modèles de segmentation sémantique

Examiner les attaques adversariales et la robustesse des modèles en segmentation sémantique.

2025-07-14T09:27:54+00:00 ― 7 min lire

Apprentissage automatique Nouveau cadre pour expliquer les décisions de l'IA

Présentation de PACE, une approche structurée pour des explications d'IA fiables.

2025-07-13T03:51:48+00:00 ― 7 min lire

Apprentissage automatique Pratiques douteuses dans l'évaluation de l'apprentissage automatique

Un aperçu des pratiques qui sapent la confiance dans les évaluations des modèles d'apprentissage automatique.

2025-07-12T19:16:54+00:00 ― 9 min lire

Calcul et langage Évaluation des modèles multimodaux sur le benchmark VALSE

Cet article examine l'efficacité des modèles multimodaux en utilisant des données linguistiques et visuelles.

2025-07-11T16:17:24+00:00 ― 10 min lire

Apprentissage automatique Une nouvelle approche pour évaluer les caractéristiques dans les modèles d'IA

Voici GOAR, une méthode pour mieux comprendre l'importance des caractéristiques en IA.

2025-07-11T13:23:36+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer à la mauvaise calibration dans les modèles vision-langage

Cet article traite des problèmes de mauvaise calibration dans les modèles vision-langage et propose des solutions.

2025-07-11T01:08:54+00:00 ― 7 min lire

Son Évaluer le raisonnement dans les modèles audio-langage

Cette étude évalue les compétences en raisonnement des modèles audio-langage avec une nouvelle tâche.

2025-07-10T09:54:05+00:00 ― 9 min lire

Apprentissage automatique Évaluer les méthodes d'adaptation en temps de test en apprentissage machine

Une étude sur l'amélioration des méthodes TTA pour les variations des données du monde réel.

2025-07-10T06:03:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Évaluer des modèles multimodaux avec MIBench

MIBench teste la performance des modèles multimodaux sur plusieurs images.

2025-07-09T14:23:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection OOD avec des modèles vision-langage

Avancées dans la détection de données hors distribution grâce à de nouvelles techniques.

2025-07-08T10:44:18+00:00 ― 8 min lire

Calcul et langage Évaluation des modèles de langage à long contexte avec l'ICL à vie

Une nouvelle méthode pour évaluer les capacités d'apprentissage des modèles de langue à long contexte grâce à Task Haystack.

2025-07-08T10:20:36+00:00 ― 10 min lire

Apprentissage automatique Évaluer la performance du modèle sur des tâches variées

Cet article analyse la performance des modèles sur différentes tâches et ensembles de données.

2025-07-08T02:42:24+00:00 ― 6 min lire

Théorie des statistiques Évaluation des modèles de machine learning : validation croisée vs. approche plug-in

Un aperçu des méthodes d'évaluation des modèles et de leur efficacité.

2025-07-06T20:49:44+00:00 ― 7 min lire

Apprentissage automatique Défis du Deep Learning Bayésien : Le Trou de l'Incertitude Épistémique

Explorer les problèmes d'incertitude épistémique dans les méthodes de Deep Learning bayésien.

2025-07-06T09:08:48+00:00 ― 7 min lire

Intelligence artificielle Évaluer les grands modèles de langage : une approche complète

Explore différents cadres et méthodes pour évaluer efficacement de grands modèles de langage.

2025-07-06T02:07:18+00:00 ― 8 min lire

Calcul et langage Optimisation de l'évaluation des modèles de langage avec Metabench

Un nouveau cadre de référence améliore l'efficacité pour évaluer les modèles de langage.

2025-07-05T16:27:28+00:00 ― 7 min lire