Derniers articles pour Évaluation du modèle

Vision par ordinateur et reconnaissance des formes Évaluer les modèles vision-langage : Le rôle de l'incertitude

Cette étude met en avant l'importance de l'incertitude dans l'évaluation des Modèles Vision-Langage.

2025-09-05T01:43:42+00:00 ― 9 min lire

Intelligence artificielle Évaluer la fiabilité des modèles de machine learning

Un aperçu de la fiabilité de l'apprentissage automatique et des réseaux de neurones profonds.

2025-09-04T20:20:54+00:00 ― 12 min lire

Vision par ordinateur et reconnaissance des formes Évaluer la fiabilité des modèles de texte à image

Un aperçu du cadre ProTIP pour évaluer les modèles de génération d'images IA.

2025-09-04T19:48:12+00:00 ― 9 min lire

Calcul et langage Évaluer la véracité dans les grands modèles de langage

Une nouvelle méthode pour évaluer la précision des résultats des LLM en utilisant les dimensions intrinsèques locales.

2025-09-03T20:29:54+00:00 ― 6 min lire

Théorie des statistiques Avancées dans le Bayes Factor pour la comparaison de modèles

Les développements récents dans le Bayes Factor améliorent l'évaluation des modèles en statistiques.

2025-09-03T15:52:28+00:00 ― 5 min lire

Son La Mélodie de Synthia : Un nouvel outil pour la recherche audio

La mélodie de Synthia aide les chercheurs à tester des modèles audio avec des données variées.

2025-09-03T14:36:25+00:00 ― 7 min lire

Calcul et langage S'attaquer à la mauvaise calibration des modèles NLP adversaires

Examen de l'impact de la mauvaise calibration sur la résilience des modèles NLP face aux attaques adversariales.

2025-09-03T12:04:18+00:00 ― 8 min lire

Apprentissage automatique Améliorer la sécurité des modèles linguistiques grâce à des équipes rouges motivées par la curiosité

Une nouvelle méthode renforce la robustesse des tests des modèles de langage en mettant l'accent sur la nouveauté.

2025-09-02T23:33:48+00:00 ― 10 min lire

Apprentissage automatique S'attaquer aux vulnérabilités dans les modèles d'apprentissage automatique

Examiner l'entraînement adversarial pour des modèles de machine learning plus robustes face aux attaques.

2025-09-02T23:11:08+00:00 ― 8 min lire

Calcul et langage Défis dans l'extraction de relations pour les modèles de langage

Les grands modèles de langage ont du mal à extraire avec précision les relations entre les entités.

2025-09-02T19:21:00+00:00 ― 6 min lire

Calcul et langage S'attaquer à l'hallucination de nombres dans les modèles vision-langage

Cet article met en avant les défis liés à la précision des comptages dans les modèles d'IA.

2025-09-02T06:03:06+00:00 ― 9 min lire

Calcul et langage Nouveau standard pour évaluer les compétences en raisonnement des MLLM

NPHardEval4V évalue les capacités de raisonnement des modèles de langage multimodaux de grande taille.

2025-09-01T13:19:48+00:00 ― 10 min lire

Calcul et langage Évaluer les modèles de langage avec le dataset PARADISE

Un nouveau dataset pour évaluer les compétences de planification des modèles linguistiques dans des tâches de la vie réelle.

2025-09-01T03:19:24+00:00 ― 9 min lire

Cryptographie et sécurité Nouveau critère pour évaluer la résilience des modèles face aux attaques

Introduction de l'hypervolume adversarial pour mieux évaluer la performance des modèles de deep learning.

2025-08-31T03:37:24+00:00 ― 9 min lire

Apprentissage automatique Évaluation des Transformers simplifiés pour la prévision de séries temporelles

Ce boulot analyse la performance des transformateurs simplifiés dans les tâches de prévision.

2025-08-30T16:44:52+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Évaluation des modèles de langage multimodaux avec le benchmark CoIN

Un nouveau benchmark évalue l'apprentissage continu dans les modèles de langage multimodaux.

2025-08-29T17:23:24+00:00 ― 8 min lire

Apprentissage automatique Comprendre le cadre PAC-Bayes pour la généralisation des modèles

Un aperçu du PAC-Bayes et de son impact sur la performance des modèles.

2025-08-29T13:12:40+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes AVIBench : Nouvel outil pour évaluer les LVLM face aux attaques adversariales

AVIBench teste les LVLMs pour s'assurer qu'ils résistent aux instructions visuelles adverses.

2025-08-29T08:26:12+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Évaluation de VMamba : un nouveau modèle en vision par ordinateur

Cet article passe en revue les forces et les faiblesses du modèle VMamba.

2025-08-28T20:11:30+00:00 ― 6 min lire

Calcul et langage Examen de la fidélité dans les explications des modèles de langage

Une étude comparant les explications des modèles multilingues et monolingues et leur fidélité.

2025-08-27T21:16:54+00:00 ― 9 min lire

Apprentissage automatique Évaluer la créativité dans les modèles génératifs avec le score KEN

Une nouvelle méthode pour évaluer la nouveauté dans les résultats de l'IA générative.

2025-08-25T21:35:40+00:00 ― 7 min lire

Apprentissage automatique Méthodes pour classer des données et estimer l'incertitude

Explore différents modèles utilisés pour la classification de données et l'estimation de l'incertitude.

2025-08-25T04:04:16+00:00 ― 7 min lire

Calcul et langage GAHD : Lutter contre les discours de haine dans les textes allemands

Un nouveau jeu de données vise à améliorer les modèles de détection de discours haineux pour la langue allemande.

2025-08-24T16:39:06+00:00 ― 7 min lire

Calcul et langage Évaluer les modèles de PNL à travers la distribution des données

Ce papier examine comment les données affectent l'évaluation des modèles de NLP.

2025-08-23T22:13:06+00:00 ― 7 min lire

Intelligence artificielle IsoBench : Un nouvel outil pour l'évaluation des modèles

IsoBench évalue comment les modèles gèrent le texte et les images pour identifier leurs points forts.

2025-08-23T16:57:06+00:00 ― 4 min lire

Apprentissage automatique Attaques adversariales en apprentissage automatique : un aperçu

Apprends sur les attaques adversariales et leur impact sur les modèles de machine learning.

2025-08-20T13:14:36+00:00 ― 9 min lire

Calcul et langage Évaluer la sécurité dans les modèles de langage

Une étude comparant la performance en matière de sécurité des modèles de langage populaires.

2025-08-19T13:40:30+00:00 ― 7 min lire

Apprentissage automatique Analyser l'impact des données d'entraînement sur les modèles d'IA

Un cadre pour évaluer comment les données d'entraînement influencent le comportement des modèles d'IA.

2025-08-17T09:08:24+00:00 ― 13 min lire

Calcul et langage Évaluer les modèles de langage avec le benchmark VISLA

Un nouveau référentiel évalue la compréhension des modèles de langage sur les significations et les relations des mots.

2025-08-16T08:07:24+00:00 ― 7 min lire

Apprentissage automatique Évaluation de la stabilité de l'apprentissage automatique avec la robustesse harmonique

Une méthode pour vérifier la fiabilité d'un modèle sans vraies étiquettes.

2025-08-15T13:17:42+00:00 ― 7 min lire

Calcul et langage Évaluer la représentation des connaissances dans les modèles de langue

Une étude comparant les méthodes d'attribution d'instance et de neurone dans les modèles de langue.

2025-08-15T11:50:48+00:00 ― 9 min lire

Apprentissage automatique Apprentissage par transfert : Aperçus sur la performance des modèles

Explorer comment le transfert d'apprentissage impacte l'efficacité des modèles dans différents contextes de données.

2025-08-15T11:15:40+00:00 ― 7 min lire

Cosmologie et astrophysique nongalactique Une nouvelle approche pour la comparaison de modèles en cosmologie

Présentation de la méthode FB pour une meilleure évaluation des modèles en cosmologie.

2025-08-15T06:15:16+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Évaluer la confiance de l'IA dans l'estimation de l'incertitude

Une étude révèle des problèmes de confiance excessive dans les modèles de langage et de vision IA.

2025-08-13T16:08:00+00:00 ― 8 min lire

Apprentissage automatique Accélérer la sélection de modèle avec un arrêt précoce

Cet article parle de l'arrêt précoce pour améliorer l'efficacité de la sélection des modèles en apprentissage automatique.

2025-08-13T09:01:24+00:00 ― 8 min lire

Apprentissage automatique Embeddings de variables partagées dans l'apprentissage multitâche

Explorer les avantages et les défis des embeddings de variables partagées en apprentissage automatique.

2025-08-12T00:38:00+00:00 ― 9 min lire

Informatique neuronale et évolutive Améliorer la programmation génétique avec la minimisation consciente de la netteté

De nouvelles techniques améliorent la fiabilité et la simplicité des modèles de programmation génétique.

2025-08-10T15:43:00+00:00 ― 10 min lire

Apprentissage automatique AnyLoss : Une nouvelle approche pour l'évaluation des modèles

Présentation d'AnyLoss, qui transforme les métriques en fonctions de perte pour un meilleur entraînement des modèles.

2025-08-08T09:12:24+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la transparence dans la détection d'objets par IA

Cet article parle de nouvelles méthodes pour expliquer les décisions de l'IA dans la détection d'objets.

2025-08-06T11:23:12+00:00 ― 8 min lire

Apprentissage automatique Naviguer dans les vulnérabilités de l'IA : Exemples adversariaux

Un aperçu de comment les exemples adversariaux défient les modèles d'IA.

2025-08-06T05:43:30+00:00 ― 7 min lire