Derniers articles pour Évaluation

Calcul et langage Une nouvelle métrique de densité améliore l'évaluation des systèmes de dialogue

DEnsity propose une nouvelle façon d'évaluer les systèmes de dialogue en se basant sur les habitudes de conversation humaines.

2025-11-19T08:03:48+00:00 ― 9 min lire

Recherche d'informations Améliorer les recommandations grâce à l'intégration des retours utilisateurs

Cet article parle des avantages d'utiliser des retours d'utilisateurs variés pour de meilleures recommandations.

2025-11-18T22:03:24+00:00 ― 8 min lire

Calcul et langage ArgU : Un nouvel outil pour générer des arguments

ArgU crée des arguments structurés basés sur des infos concrètes pour des discussions efficaces.

2025-11-18T18:06:24+00:00 ― 7 min lire

Calcul et langage Évaluation de GPT-3 dans la synthèse médicale

Cette étude évalue la capacité de GPT-3 à résumer efficacement la littérature médicale.

2025-11-18T08:06:00+00:00 ― 7 min lire

Son Mesurer la beauté dans la musique : Une nouvelle approche

Une méthode mathématique pour évaluer la beauté des performances musicales.

2025-11-18T07:37:25+00:00 ― 6 min lire

Dentisterie et médecine bucco-dentaire Améliorer les soins dentaires au Brésil : Une étude

Cette étude évalue les soins parodontaux dans les Centres de Spécialité Dentaire au Brésil.

2025-11-18T03:45:30+00:00 ― 6 min lire

Calcul et langage Évaluer les raisons générées par les machines pour les utilisateurs humains

Cet article examine l'efficacité des explications générées par l'IA pour les utilisateurs.

2025-11-17T22:53:00+00:00 ― 10 min lire

Son DCASE 2023 : Faire avancer la synthèse automatique de son Foley

Une compétition pour améliorer la création de sons Foley automatisés pour les multimédias.

2025-11-17T14:37:10+00:00 ― 7 min lire

Calcul et langage Présentation de C-Eval : Un nouvel outil d'évaluation pour les modèles de langue chinoise

C-Eval évalue les compétences en raisonnement et en connaissances des LLMs en chinois.

2025-11-17T02:52:12+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la compréhension des documents : un nouveau jeu de données

Un nouveau jeu de données améliore la façon dont les machines lisent et répondent aux documents.

2025-11-16T12:39:00+00:00 ― 7 min lire

Calcul et langage Évaluation du jeu de données RACE sur la compréhension de lecture

Une analyse des forces et faiblesses du jeu de données RACE pour la compréhension de lecture.

2025-11-16T12:15:18+00:00 ― 10 min lire

Calcul et langage Évaluation des revendications de performances surhumaines en PNL

Un regard critique sur les benchmarks des modèles de langage et leurs implications pour la performance humaine.

2025-11-16T11:51:36+00:00 ― 7 min lire

Calcul et langage Aborder les scores manquants dans les évaluations NLP

Cet article présente une nouvelle méthode pour gérer les scores manquants dans les évaluations des systèmes NLP.

2025-11-15T11:45:54+00:00 ― 8 min lire

Calcul et langage Faire avancer l'empathie dans les chatbots

Apprends comment les chatbots sont formés pour répondre avec empathie.

2025-11-15T09:00:00+00:00 ― 6 min lire

Calcul et langage mLongT5 : Avancer le traitement de texte multilingue

mLongT5 gère efficacement de longs textes dans plusieurs langues.

2025-11-15T00:10:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'évaluation de la synthèse texte-image

Une nouvelle méthode améliore notre façon d'évaluer les images générées par l'IA à partir de descriptions textuelles.

2025-11-15T00:02:48+00:00 ― 7 min lire

Calcul et langage Avancées dans la génération de scripts hiérarchiques

Une étude sur la création d'instructions structurées grâce à la décomposition hiérarchique des tâches.

2025-11-14T19:26:18+00:00 ― 8 min lire

Calcul et langage IKDSumm : Une nouvelle approche pour résumer les tweets sur les désastres

IKDSumm résume efficacement les tweets pendant les désastres en utilisant des connaissances spécifiques aux désastres.

2025-11-14T07:51:06+00:00 ― 7 min lire

Intelligence artificielle Améliorer les LLMs : La taxonomie TELeR

Une nouvelle taxonomie pour améliorer la performance des LLM sur des tâches complexes.

2025-11-14T04:49:24+00:00 ― 8 min lire

Calcul et langage Évaluer des arguments dans un monde mal informé

Une nouvelle méthode pour évaluer la qualité des arguments en prenant en compte le contexte.

2025-11-14T03:46:12+00:00 ― 6 min lire

Calcul et langage Évaluation des modèles de langue : un regard de plus près

Une étude évalue les méthodes pour évaluer les modèles de langage dans la compréhension du langage.

2025-11-13T03:08:54+00:00 ― 8 min lire

Calcul et langage Présentation de Seahorse : un jeu de données de résumé multilingue

Seahorse propose une grosse collection de résumés multilingues avec des notes de la part des humains.

2025-11-13T01:42:00+00:00 ― 8 min lire

Calcul et langage Contenu culturel dans la traduction automatique : Nouvelles perspectives

Recherche sur les avancées dans la traduction des références culturelles avec des systèmes de traduction automatique.

2025-11-12T14:14:42+00:00 ― 11 min lire

Intelligence artificielle Connecter Différents Types de Données avec LoReTTa

Une nouvelle méthode pour intégrer différents types de données médicales pour une meilleure analyse.

2025-11-12T13:51:00+00:00 ― 12 min lire

Calcul et langage Évaluer les modèles de langage : Combler le fossé démographique

Évaluer la performance des modèles de langage pour différentes démographies humaines est super important pour une utilisation efficace.

2025-11-12T13:35:12+00:00 ― 7 min lire

Calcul et langage Défis des modèles de langage augmentés par récupération

Une étude révèle des limites des modèles de langage augmentés par récupération pour la génération de texte.

2025-11-12T08:11:18+00:00 ― 7 min lire

Calcul et langage Une nouvelle façon d'aborder le raisonnement sur des documents longs

Présentation d'un cadre structuré pour bien raisonner sur de longs textes.

2025-11-12T05:41:12+00:00 ― 5 min lire

Calcul et langage Présentation de MMSMR : Un nouveau jeu de données pour évaluer les chatbots

Le dataset MMSMR vise à améliorer l'évaluation des conversations de chatbots avec des réponses humaines variées.

2025-11-12T04:38:00+00:00 ― 6 min lire

Calcul et langage Normes culturelles : Une comparaison entre la Chine et l'Amérique

Cette étude compare les normes sociales entre les cultures chinoise et américaine à travers l'analyse de données.

2025-11-12T03:50:36+00:00 ― 8 min lire

Calcul et langage Amélioration de la résumation des tableaux pour les requêtes des utilisateurs

Une nouvelle façon de résumer des tableaux selon les questions des utilisateurs pour de meilleures analyses.

2025-11-12T00:48:54+00:00 ― 8 min lire

Calcul et langage Une nouvelle façon d'évaluer le texte généré

Présentation d'un système qui explique clairement l'évaluation des textes générés par des machines.

2025-11-12T00:17:18+00:00 ― 7 min lire

Calcul et langage Avancées dans les modèles de langue multilingues

Un nouveau jeu de données améliore la capacité des modèles de langage à comprendre des instructions dans différentes langues.

2025-11-10T17:20:48+00:00 ― 6 min lire

Calcul et langage Améliorer la précision des modèles linguistiques

Une nouvelle méthode s'attaque aux défis que rencontrent les modèles linguistiques pour donner des réponses précises.

2025-11-10T09:58:24+00:00 ― 7 min lire

Apprentissage automatique Évaluation des classifieurs abstentionnistes avec des scores contrefactuels

Une méthode pour évaluer les classificateurs abstentionnistes en estimant leurs prédictions manquantes.

2025-11-10T06:52:08+00:00 ― 10 min lire

Recherche d'informations Le rôle des questions de clarification dans les systèmes de conversation

Les questions de clarification sont essentielles pour une communication efficace dans les systèmes conversationnels.

2025-11-09T18:34:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Résumer les vidéos en langue des signes pour une meilleure communication

Une nouvelle méthode améliore la résumation vidéo pour le contenu en langue des signes.

2025-11-09T12:22:48+00:00 ― 6 min lire

Calcul et langage Avancer les techniques de liaison d'entités multimodales diverses

Améliorer les capacités du modèle pour relier efficacement différents types de données.

2025-11-09T09:44:48+00:00 ― 6 min lire

Calcul et langage Hub de Chaîne de Pensée : Évaluer le Raisonnement dans les Modèles de Langage

Un outil pour évaluer les capacités de raisonnement en plusieurs étapes des grands modèles de langage.

2025-11-09T08:41:36+00:00 ― 7 min lire

Calcul et langage Une nouvelle approche pour évaluer les résumés

Combiner des méthodes basées sur des références et sans références pour améliorer l'évaluation des résumés.

2025-11-09T01:11:18+00:00 ― 7 min lire

Calcul et langage Les LLMs déchirent par rapport aux systèmes traditionnels pour la traduction

Une étude montre que les LLMs offrent des traductions plus naturelles, surtout pour les expressions idiomatiques.

2025-11-08T23:12:48+00:00 ― 6 min lire