Derniers articles pour Évaluation

Calcul et langage Présentation de SciEval : Une nouvelle référence pour les tests de LLM en science

SciEval évalue les modèles de langage sur leurs compétences en recherche scientifique avec des questions variées.

2025-10-05T01:01:24+00:00 ― 7 min lire

Interaction homme-machine Évaluation des systèmes d'orientation en analyse visuelle

Une approche pratique pour évaluer les systèmes de guidage pour une analyse de données efficace.

2025-10-04T23:02:54+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la classification des documents pour les applications réelles

Cet article parle de la nécessité d'améliorer les techniques de classification des documents.

2025-10-04T21:43:54+00:00 ― 8 min lire

Optimisation et contrôle Amélioration des systèmes de freins aériens avec la technologie IA

Combiner des réseaux de neurones avec des méthodes traditionnelles améliore la sécurité et la performance des freins à air.

2025-10-04T20:23:40+00:00 ― 7 min lire

Calcul et langage Évaluation de la traduction automatique : Mesures de phrase vs. mesures de paragraphe

Cet article examine à quel point les méthodes d'évaluation actuelles notent les traductions au niveau des paragraphes.

2025-10-04T14:29:24+00:00 ― 7 min lire

Calcul et langage Évaluation des modèles de langage dans la santé : un nouveau jeu de données

Un nouveau jeu de données aide à évaluer les modèles de langage pour les applications de santé.

2025-10-03T22:25:36+00:00 ― 9 min lire

Son Avancées dans l'amélioration de la parole grâce aux réseaux de neurones à pics

Une nouvelle méthode pour améliorer la qualité de la parole en utilisant des réseaux éconergétiques.

2025-10-03T21:44:15+00:00 ― 6 min lire

Calcul et langage Un nouveau jeu de données pour la génération de connaissances conversationnelles

Présentation d'un jeu de données axé sur des conversations questions-réponses factuelles.

2025-10-03T00:26:18+00:00 ― 7 min lire

Épidémiologie Évaluation des systèmes de surveillance One Health en Europe

Une étude évalue l'efficacité de la surveillance One Health à travers onze systèmes européens.

2025-10-02T14:44:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Évaluation des propositions d'objets dans les tâches vision-langage

Une nouvelle méthode pour mieux évaluer les propositions d'objets dans les tâches de vision et de langage.

2025-10-02T04:25:30+00:00 ― 8 min lire

Calcul et langage Avancées dans les systèmes d'évaluation de dialogue multilingue

Les chercheurs utilisent la traduction automatique pour améliorer les évaluations de la qualité des dialogues dans différentes langues.

2025-10-02T01:08:00+00:00 ― 7 min lire

Calcul et langage S'attaquer à l'hallucination dans les grands modèles de langage

Cet article examine les hallucinations dans les modèles de langage IA et les recherches en cours.

2025-10-01T04:19:48+00:00 ― 9 min lire

Bases de données Défis dans l'Optimisation des Requêtes Apprises

Examiner les problèmes et les solutions pour les optimisateurs de requêtes appris dans la gestion de bases de données.

2025-10-01T01:26:00+00:00 ― 6 min lire

Calcul et langage Nouveau jeu de données HAE-RAE Bench évalue les modèles de langue coréens

Le banc HAE-RAE se concentre sur l'évaluation des connaissances culturelles dans les modèles de langue coréenne.

2025-09-30T02:31:24+00:00 ― 8 min lire

Calcul et langage Évaluation du raisonnement dans les modèles vision-langage

Ce travail évalue à quel point les VLMs raisonnent en se basant sur le contenu visuel.

2025-09-29T06:14:48+00:00 ― 8 min lire

Calcul et langage Créer des questions de relance efficaces

Une étude sur la création de questions de suivi pertinentes pour approfondir la compréhension.

2025-09-28T14:03:06+00:00 ― 8 min lire

Calcul et langage Avancer la synthèse vocale expressive avec un nouveau dataset

Un nouveau jeu de données améliore la synthèse vocale en capturant l'expression émotionnelle sans se baser sur le texte.

2025-09-27T18:22:05+00:00 ― 7 min lire

Interaction homme-machine Un Nouveau Modèle pour Comprendre les Émotions

Un modèle qui combine l'évaluation et l'apprentissage par renforcement améliore l'évaluation émotionnelle.

2025-09-27T18:10:12+00:00 ― 6 min lire

Calcul et langage Classer les révisions dans les essais argumentatifs

Cette étude examine comment classifier les révisions pour améliorer l'écriture argumentative.

2025-09-27T09:44:36+00:00 ― 7 min lire

Calcul et langage Évaluer les modèles de langage dans différentes langues

Explorer comment les LLM peuvent évaluer les sorties de modèles dans plusieurs langues.

2025-09-27T00:00:00+00:00 ― 8 min lire

Calcul et langage Améliorer la qualité de la traduction avec une évaluation contextuelle

SLIDE améliore les évaluations de traduction automatique en intégrant un contexte plus large pendant l'évaluation.

2025-09-26T15:10:42+00:00 ― 7 min lire

Robotique Nouvelle méthode pour la navigation des robots mobiles

Cette méthode améliore la planification des trajets des robots mobiles dans des environnements changeants.

2025-09-26T02:56:00+00:00 ― 8 min lire

Calcul et langage Évaluation de la réponse à des questions longues dans les modèles linguistiques

Cette étude compare les performances de plusieurs modèles de langage pour répondre à des questions complexes.

2025-09-26T02:24:24+00:00 ― 6 min lire

Traitement de l'audio et de la parole Évaluer un système de masquage sonore automatique dans les parcs urbains

Une étude examine l'efficacité des masques sonores automatisés dans les espaces publics.

2025-09-25T18:35:40+00:00 ― 5 min lire

Génie logiciel Fuzzing dirigé : Test logiciel ciblé pour découvrir des bugs

Une approche ciblée pour identifier rapidement les bugs logiciels grâce à des tests ciblés.

2025-09-25T00:36:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer le diagnostic du cancer avec des signaux de causalité dans les images médicales

Une nouvelle méthode améliore le diagnostic du cancer en intégrant des signaux de causalité faibles dans l'imagerie médicale.

2025-09-24T21:02:42+00:00 ― 9 min lire

Calcul et langage Avancées dans le transfert de style de texte complexe

De nouvelles méthodes améliorent le transfert de style pour le texte tout en gardant le sens.

2025-09-24T17:53:06+00:00 ― 8 min lire

Calcul et langage Lutter contre la haine dans le dialecte algérien

Une étude sur la détection de discours haineux dans le langage des réseaux sociaux algériens.

2025-09-24T05:22:36+00:00 ― 9 min lire

Calcul et langage Évaluer les chatbots de santé : critères de réussite

Cet article parle des métriques d'évaluation pour des chatbots de santé efficaces.

2025-09-23T19:53:48+00:00 ― 8 min lire

Intelligence artificielle Faire évoluer des modèles de Deep Learning avec une évolution régularisée

Cette étude examine comment les modèles d'apprentissage profond évoluent pendant la recherche d'architecture neuronale.

2025-09-23T17:07:54+00:00 ― 9 min lire

Logique en informatique Amélioration de l'évaluation des expressions en calcul lambda

Découvre une nouvelle méthode pour améliorer l'efficacité d'évaluation dans le calcul des lambda.

2025-09-23T16:28:24+00:00 ― 8 min lire

Apprentissage automatique SALSA-CLRS : Un nouveau benchmark pour les algos

Présentation de SALSA-CLRS pour améliorer l'évaluation des algos avec des graphes épars.

2025-09-23T14:06:12+00:00 ― 7 min lire

Calcul et langage Une nouvelle façon d'évaluer les systèmes de réponse aux questions

La métrique SQuArE améliore l'évaluation des systèmes de Q&R grâce à plusieurs références de réponse.

2025-09-23T13:58:18+00:00 ― 7 min lire

Apprentissage automatique Améliorer la santé en ligne avec la classification automatique

Un nouveau système vise à connecter les utilisateurs avec des professionnels de la santé grâce à une classification automatisée.

2025-09-21T11:16:48+00:00 ― 6 min lire

Calcul et langage L'avenir de la télémédecine : résumer les interactions avec les patients

Les progrès dans le résumé des conversations entre médecins et patients améliorent la communication en télémédecine.

2025-09-21T04:18:06+00:00 ― 11 min lire

Langages de programmation Prouver la fiabilité dans le calcul des λ simplement typé

Explorer des techniques de preuve pour évaluer des fonctions dans les langages de programmation.

2025-09-21T03:46:30+00:00 ― 7 min lire

Structures de données et algorithmes L'importance de la stabilité des préférences individuelles dans le clustering

La stabilité dans le clustering garantit que les groupes sont efficaces et significatifs.

2025-09-20T18:01:54+00:00 ― 7 min lire

Apprentissage automatique Présentation de GRANDE : Une nouvelle méthode pour les données tabulaires

GRANDE utilise la descente de gradient pour améliorer l'apprentissage à partir de données tabulaires.

2025-09-20T08:17:18+00:00 ― 6 min lire

Calcul et langage Évaluer les modèles d'IA avec des méta-caractéristiques

Une nouvelle méthode pour évaluer les modèles d'IA grâce à des embeddings et des méta caractéristiques.

2025-09-19T10:10:06+00:00 ― 8 min lire

Calcul et langage Insights Automatisés dans l'Analyse de Textes Juridiques

Une nouvelle méthode révèle des tendances dans les décisions juridiques en utilisant l'analyse de texte automatisée.

2025-09-19T06:21:00+00:00 ― 10 min lire