Derniers articles pour Évaluation

Génie logiciel Améliorer la revue de code avec ReviewRanker

Un nouveau système pour améliorer le processus de revue de code et garantir la qualité.

2025-10-22T07:46:24+00:00 ― 7 min lire

Apprentissage automatique Une approche durable pour la recherche d'architectures neurales

Un nouveau cadre équilibre l'efficacité de l'apprentissage profond et les émissions de carbone.

2025-10-22T01:58:48+00:00 ― 8 min lire

Médecine légale Défis auxquels font face les enfants non accompagnés cherchant asile

Plus de 300 000 enfants demandent l'asile aux États-Unis, confrontés à de nombreux obstacles.

2025-10-21T16:46:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole FALL-E : Une nouvelle ère dans la création sonore

FALL-E crée des effets sonores de haute qualité à partir de descriptions textuelles.

2025-10-21T13:13:20+00:00 ― 6 min lire

Intelligence artificielle Défis de l'IA explicable : Plongée profonde

Examiner les problèmes et le potentiel des méthodes d'IA explicable.

2025-10-20T10:13:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Utiliser le langage pour créer des scénarios de trafic dynamiques

Une méthode qui génère des scènes de circulation en utilisant du langage naturel pour des tests de conduite autonome.

2025-10-19T09:27:48+00:00 ― 9 min lire

Calcul et langage L'essor des petits modèles de langue

Découvre le potentiel des petits modèles de langage dans la tech AI.

2025-10-19T09:12:00+00:00 ― 7 min lire

Calcul et langage Améliorer l'évaluation de la taxonomie avec des modèles de langage

Une nouvelle méthode pour évaluer les taxonomies avec des modèles de langage montre du potentiel.

2025-10-18T17:08:12+00:00 ― 9 min lire

Calcul et langage Évaluer les effets d'entraînement dans l'édition de connaissances

De nouvelles recherches soulignent l'importance des effets d'entraînement dans la mise à jour des modèles linguistiques.

2025-10-16T11:40:48+00:00 ― 10 min lire

Systèmes multi-agents Améliorer le Budget Participatif grâce au Consensus

Une nouvelle méthode améliore l’équité dans le budget participatif en favorisant le dialogue entre les électeurs.

2025-10-16T11:01:18+00:00 ― 7 min lire

Communication scientifique et éducation Examen de la clarté du langage dans le processus de révision par les pairs d'eLife

Une étude évalue la clarté des phrases de la revue par les pairs d'eLife et propose des améliorations.

2025-10-16T05:29:36+00:00 ― 7 min lire

Recherche d'informations Évaluation des systèmes de recommandation : DCG vs nDCG

Un aperçu de l'efficacité des métriques de recommandation dans les expériences utilisateur.

2025-10-15T06:11:12+00:00 ― 12 min lire

Apprentissage automatique Évaluer l'incertitude dans les modèles d'apprentissage automatique

Évaluer la capacité des modèles à estimer l'incertitude pour de meilleures prédictions.

2025-10-15T03:22:00+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la génération d'images à partir de descriptions textuelles

Une nouvelle méthode améliore comment les images correspondent aux entrées de texte.

2025-10-14T14:00:56+00:00 ― 8 min lire

Calcul et langage Nouveau benchmark d'évaluation pour les modèles multimodaux

Un nouveau critère vise à améliorer l'évaluation des modèles de langage multimodaux.

2025-10-14T06:05:30+00:00 ― 8 min lire

Calcul et langage Évaluation des stratégies d'apprentissage actif en PNL

Un cadre pour comparer les méthodes d'apprentissage actif afin d'améliorer l'efficacité du balisage de données.

2025-10-13T16:31:48+00:00 ― 8 min lire

Calcul et langage Nouvelle méthode pour évaluer les réponses des modèles de langue

Une nouvelle approche utilise des réseaux plus larges pour améliorer la qualité d'évaluation des modèles de langue.

2025-10-12T17:13:30+00:00 ― 7 min lire

Calcul et langage Traiter les biais dans les données textuelles : Le cadre Nbias

Un cadre pour identifier et réduire les biais dans les données textuelles pour des résultats plus équitables.

2025-10-12T14:51:18+00:00 ― 12 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la génération de données radar pour la conduite automatisée

Une nouvelle méthode utilise des GANs pour créer des données radar réalistes pour une conduite automatisée plus sûre.

2025-10-12T08:40:00+00:00 ― 6 min lire

Cryptographie et sécurité Évaluation des détecteurs d'abus de Crypto-API avec MASC

MASC propose une nouvelle façon de tester efficacement les détecteurs de mauvaise utilisation des API crypto.

2025-10-12T06:49:24+00:00 ― 6 min lire

Optimisation et contrôle Optimisation Stochastique : Gérer l'Incertitude dans la Prise de Décision

Apprends comment l'optimisation stochastique gère l'incertitude dans différents domaines.

2025-10-12T04:55:12+00:00 ― 6 min lire

Calcul et langage Améliorer les évaluations de résumé avec conscience de redondance

Une nouvelle métrique améliore la qualité des résumés en s'attaquant à la redondance et aux références multiples.

2025-10-12T04:11:24+00:00 ― 7 min lire

Génie logiciel Évaluation des grands modèles de langage pour le code

De nouvelles méthodes améliorent la compréhension des modèles de langage utilisés pour les tâches de codage.

2025-10-11T13:18:42+00:00 ― 8 min lire

Calcul et langage Présentation de SciGraphQA : un nouveau jeu de données pour les graphes scientifiques

SciGraphQA offre un super dataset pour comprendre les graphes scientifiques grâce au question-réponse.

2025-10-11T06:20:00+00:00 ― 7 min lire

Calcul et langage CheXOFA : Un pas vers le rapport automatisé de radiographies

CheXOFA résume les rapports de radiographies thoraciques, améliorant l'efficacité dans le secteur de la santé.

2025-10-11T05:26:50+00:00 ― 6 min lire

Calcul et langage Présentation de CLEVA : Une plateforme d'évaluation pour les modèles de langue chinois

CLEVA propose des évaluations standardisées pour évaluer efficacement les modèles de langue chinois.

2025-10-10T07:57:00+00:00 ― 8 min lire

Recherche d'informations Tendances dans les recommandations de POI personnalisées pour les touristes

Examen des récentes avancées dans les systèmes de recommandation de POI de 2017 à 2022.

2025-10-09T04:25:54+00:00 ― 13 min lire

Apprentissage automatique Présentation d'UPREVE : Un outil pour la découverte causale

UPREVE simplifie la découverte causale dans les systèmes sociaux et comportementaux pour les chercheurs.

2025-10-08T18:39:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Nouvelle méthode d'évaluation pour la synthèse texte-image

Une nouvelle méthode pour évaluer la qualité de génération d'images à partir de descriptions texte.

2025-10-08T01:26:24+00:00 ― 8 min lire

Physique des hautes énergies - Expériences Génération d'images à partir de données de physique des particules en utilisant des modèles d'IA

Cet article met en avant l'utilisation de modèles génératifs pour créer des images en physique des particules.

2025-10-07T19:22:00+00:00 ― 8 min lire

Calcul et langage Présentation du Référentiel Médical Complet pour les LLM en Chine

Une nouvelle référence pour évaluer les modèles linguistiques dans des contextes médicaux chinois.

2025-10-07T18:51:24+00:00 ― 13 min lire

Apprentissage automatique Amélioration des méthodes d'attribution des caractéristiques en IA

Évaluer les méthodes d'attribution des caractéristiques via la solidité et la complétude pour de meilleures prédictions AI.

2025-10-07T18:35:36+00:00 ― 7 min lire

Calcul et langage Évaluer ChatGPT pour l'alignement d'ontologies

Cette étude évalue comment ChatGPT se débrouille pour faire correspondre des ontologies.

2025-10-07T15:57:36+00:00 ― 7 min lire

Calcul et langage Évaluation des systèmes de correction grammaticale

Un aperçu de comment évaluer efficacement les systèmes GEC.

2025-10-07T12:40:06+00:00 ― 9 min lire

Intelligence artificielle Mesurer la similarité sémantique dans DBpedia

Ce papier examine des méthodes pour évaluer la relation entre des concepts en utilisant DBpedia.

2025-10-07T02:16:00+00:00 ― 8 min lire

Calcul et langage Améliorer les modèles de langue grâce à l'ajustement des instructions

Un aperçu de comment l'ajustement des instructions améliore les réponses des modèles de langage.

2025-10-06T12:02:48+00:00 ― 11 min lire

Intelligence artificielle Évaluer les graphes de connaissances avec KGrEaT

KGrEaT évalue la qualité et l'utilité des graphes de connaissances pour différentes tâches.

2025-10-06T01:22:54+00:00 ― 6 min lire

Calcul et langage Améliorer les modèles de langue pour le portugais

Une nouvelle méthode améliore les modèles de langue spécialement pour le portugais.

2025-10-05T21:10:06+00:00 ― 6 min lire

Calcul et langage Présentation du Benchmark de Liens d'Entités Biomédicales (BELB)

Un repère standardisé pour améliorer le lien entre entités biomédicales et les comparaisons de recherche.

2025-10-05T17:28:54+00:00 ― 7 min lire

Systèmes de santé et amélioration de la qualité Relier la recherche et les soins aux patients dans les systèmes de santé

Explorer les systèmes de santé apprenants pour améliorer la livraison des soins.

2025-10-05T07:57:00+00:00 ― 8 min lire