DEnsity propose une nouvelle façon d'évaluer les systèmes de dialogue en se basant sur les habitudes de conversation humaines.
― 9 min lire
La science de pointe expliquée simplement
DEnsity propose une nouvelle façon d'évaluer les systèmes de dialogue en se basant sur les habitudes de conversation humaines.
― 9 min lire
Cet article parle des avantages d'utiliser des retours d'utilisateurs variés pour de meilleures recommandations.
― 8 min lire
ArgU crée des arguments structurés basés sur des infos concrètes pour des discussions efficaces.
― 7 min lire
Cette étude évalue la capacité de GPT-3 à résumer efficacement la littérature médicale.
― 7 min lire
Une méthode mathématique pour évaluer la beauté des performances musicales.
― 6 min lire
Cette étude évalue les soins parodontaux dans les Centres de Spécialité Dentaire au Brésil.
― 6 min lire
Cet article examine l'efficacité des explications générées par l'IA pour les utilisateurs.
― 10 min lire
Une compétition pour améliorer la création de sons Foley automatisés pour les multimédias.
― 7 min lire
C-Eval évalue les compétences en raisonnement et en connaissances des LLMs en chinois.
― 6 min lire
Un nouveau jeu de données améliore la façon dont les machines lisent et répondent aux documents.
― 7 min lire
Une analyse des forces et faiblesses du jeu de données RACE pour la compréhension de lecture.
― 10 min lire
Un regard critique sur les benchmarks des modèles de langage et leurs implications pour la performance humaine.
― 7 min lire
Cet article présente une nouvelle méthode pour gérer les scores manquants dans les évaluations des systèmes NLP.
― 8 min lire
Apprends comment les chatbots sont formés pour répondre avec empathie.
― 6 min lire
mLongT5 gère efficacement de longs textes dans plusieurs langues.
― 6 min lire
Une nouvelle méthode améliore notre façon d'évaluer les images générées par l'IA à partir de descriptions textuelles.
― 7 min lire
Une étude sur la création d'instructions structurées grâce à la décomposition hiérarchique des tâches.
― 8 min lire
IKDSumm résume efficacement les tweets pendant les désastres en utilisant des connaissances spécifiques aux désastres.
― 7 min lire
Une nouvelle taxonomie pour améliorer la performance des LLM sur des tâches complexes.
― 8 min lire
Une nouvelle méthode pour évaluer la qualité des arguments en prenant en compte le contexte.
― 6 min lire
Une étude évalue les méthodes pour évaluer les modèles de langage dans la compréhension du langage.
― 8 min lire
Seahorse propose une grosse collection de résumés multilingues avec des notes de la part des humains.
― 8 min lire
Recherche sur les avancées dans la traduction des références culturelles avec des systèmes de traduction automatique.
― 11 min lire
Une nouvelle méthode pour intégrer différents types de données médicales pour une meilleure analyse.
― 12 min lire
Évaluer la performance des modèles de langage pour différentes démographies humaines est super important pour une utilisation efficace.
― 7 min lire
Une étude révèle des limites des modèles de langage augmentés par récupération pour la génération de texte.
― 7 min lire
Présentation d'un cadre structuré pour bien raisonner sur de longs textes.
― 5 min lire
Le dataset MMSMR vise à améliorer l'évaluation des conversations de chatbots avec des réponses humaines variées.
― 6 min lire
Cette étude compare les normes sociales entre les cultures chinoise et américaine à travers l'analyse de données.
― 8 min lire
Une nouvelle façon de résumer des tableaux selon les questions des utilisateurs pour de meilleures analyses.
― 8 min lire
Présentation d'un système qui explique clairement l'évaluation des textes générés par des machines.
― 7 min lire
Un nouveau jeu de données améliore la capacité des modèles de langage à comprendre des instructions dans différentes langues.
― 6 min lire
Une nouvelle méthode s'attaque aux défis que rencontrent les modèles linguistiques pour donner des réponses précises.
― 7 min lire
Une méthode pour évaluer les classificateurs abstentionnistes en estimant leurs prédictions manquantes.
― 10 min lire
Les questions de clarification sont essentielles pour une communication efficace dans les systèmes conversationnels.
― 8 min lire
Une nouvelle méthode améliore la résumation vidéo pour le contenu en langue des signes.
― 6 min lire
Améliorer les capacités du modèle pour relier efficacement différents types de données.
― 6 min lire
Un outil pour évaluer les capacités de raisonnement en plusieurs étapes des grands modèles de langage.
― 7 min lire
Combiner des méthodes basées sur des références et sans références pour améliorer l'évaluation des résumés.
― 7 min lire
Une étude montre que les LLMs offrent des traductions plus naturelles, surtout pour les expressions idiomatiques.
― 6 min lire