Derniers articles pour Évaluation

Apprentissage automatique Améliorer l'optimisation haute dimensionnelle avec l'amélioration de coordonnées attendues

Une nouvelle méthode améliore l'optimisation dans des problèmes coûteux à haute dimension.

2025-08-09T10:04:04+00:00 ― 8 min lire

Intelligence artificielle Évaluer les modèles de langage avec le cadre ALI-Agent

Une nouvelle méthode pour évaluer l'alignement des modèles de langage avec les valeurs humaines.

2025-08-09T06:16:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Techniques innovantes pour fusionner des invites textuelles dans la génération d'images

Une nouvelle méthode améliore la création d'images à partir de plusieurs invites textuelles.

2025-08-08T22:14:30+00:00 ― 8 min lire

Économie générale L'équilibre entre la compétition et la collaboration dans le crowdsourcing

Un aperçu des comportements dans les communautés de crowdsourcing et de leurs impacts.

2025-08-08T20:43:00+00:00 ― 9 min lire

Calcul et langage Amélioration des systèmes de dialogue grâce à la prise en compte de l'historique des conversations

Cette recherche souligne le besoin d'une meilleure évaluation de l'utilisation de l'historique des conversations par les systèmes de dialogue.

2025-08-08T14:28:24+00:00 ― 7 min lire

Calcul et langage Évaluation de la NLG avec le cadre AdvEval

AdvEval met en lumière les faiblesses des métriques d'évaluation de la génération de langage naturel.

2025-08-08T07:29:42+00:00 ― 8 min lire

Calcul et langage Un outil pour transformer des figures scientifiques

Un nouvel outil transforme des croquis en graphiques clairs pour les chercheurs.

2025-08-07T11:28:54+00:00 ― 8 min lire

Intelligence artificielle Présentation de la Preuve de Qualité pour l'IA Générative Décentralisée

Une nouvelle méthode renforce la fiabilité des résultats de l'IA dans des environnements blockchain.

2025-08-05T14:19:12+00:00 ― 12 min lire

Vision par ordinateur et reconnaissance des formes Défi NTIRE 2024 : Restauration d'Image dans le Monde Réel

Les participants s'attaquent à la restauration d'images dégradées dans un cadre compétitif.

2025-08-05T11:49:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouvelle méthode pour le suivi de scènes 3D à partir de vidéos

Un nouveau système suit et reconnaît des scènes 3D dynamiques en utilisant une seule vidéo.

2025-08-05T06:33:06+00:00 ― 8 min lire

Intelligence artificielle Segmentation des phrases musicales avec des algorithmes

Évaluation des algorithmes pour une segmentation efficace des phrases musicales et une analyse de structure.

2025-08-04T22:31:12+00:00 ― 6 min lire

Logique en informatique Repenser l'évaluation de l'intelligence : un focus sur la crédibilité

Une nouvelle méthode améliore la façon dont les messages de renseignement sont évalués en priorisant la crédibilité.

2025-08-04T15:48:18+00:00 ― 6 min lire

Calcul et langage Avancées dans l'évaluation des modèles de langue coréenne

De nouvelles ressources améliorent l'évaluation des modèles de langue coréenne.

2025-08-04T10:48:06+00:00 ― 6 min lire

Informatique neuronale et évolutive Nouveau cadre pour la génération d'algorithmes avec des LLMs

Cet article examine une nouvelle façon de créer des algorithmes avec des LLMs.

2025-08-04T07:14:48+00:00 ― 6 min lire

Intelligence artificielle Une nouvelle approche de la prise de décision avec une logique à sept valeurs

Apprends comment la logique à sept valeurs améliore la prise de décision avec plusieurs critères.

2025-08-04T05:00:30+00:00 ― 7 min lire

Traitement de l'image et de la vidéo Défi Grand AAPM 2023 sur l'imagerie médicale

Un défi axé sur des modèles génératifs profonds pour la génération d'images médicales réalistes.

2025-08-04T00:01:12+00:00 ― 12 min lire

Calcul et langage Un nouveau modèle évalue la lisibilité des articles Wikipédia dans plusieurs langues

Un modèle évalue la lisibilité des articles Wikipedia dans 14 langues.

2025-08-03T06:53:18+00:00 ― 9 min lire

Calcul et langage Automatisation de la génération de distracteurs pour la compréhension de lecture

Une nouvelle approche utilisant des LLM pour créer des distracteurs avec un minimum d'intervention humaine.

2025-08-03T00:57:48+00:00 ― 5 min lire

Intelligence artificielle Évaluer le favoritisme dans les métriques de l'IA générative

Une nouvelle approche pour évaluer les biais dans les métriques d'évaluation automatisées de l'IA.

2025-08-02T22:04:00+00:00 ― 8 min lire

Calcul et langage Faire progresser le raisonnement dans les modèles de langage

De nouvelles méthodes visent à améliorer les capacités de raisonnement des modèles de langage.

2025-08-02T09:25:36+00:00 ― 8 min lire

Calcul et langage Évaluation des modèles de langue et de leur compréhension du monde

De nouvelles métriques mettent en lumière les limites des modèles de langage dans leur capacité à représenter la réalité.

2025-08-02T05:12:48+00:00 ― 9 min lire

Apprentissage automatique Benchmarks dynamiques pour évaluer les modèles de langage

Un nouveau système pour évaluer les modèles linguistiques en utilisant des flux de données du monde réel.

2025-08-02T01:23:42+00:00 ― 7 min lire

Calcul et langage IrokoBench : Un nouveau benchmark pour les langues africaines

Présentation d'IrokoBench pour améliorer l'évaluation des LLM dans les langues africaines.

2025-08-02T00:44:12+00:00 ― 9 min lire

Traitement de l'image et de la vidéo Avancées dans la segmentation des tumeurs avec le défi ULS23

Le défi ULS23 vise à améliorer la segmentation des tumeurs dans les scans CT pour un meilleur soin du cancer.

2025-07-31T18:27:20+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouvelle méthode pour détecter les images générées par l'IA

Une nouvelle approche améliore la détection des fausses images créées par l'IA.

2025-07-30T00:58:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluation de la compréhension vidéo dans les modèles de langage multimodaux

Un nouveau standard vise à évaluer les MLLMs dans la compréhension vidéo sur plusieurs sujets.

2025-07-29T22:20:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Attribuer de l'influence dans les modèles texte-image

Cette étude présente une nouvelle méthode pour identifier les images d'entraînement clés dans les visuels générés par l'IA.

2025-07-29T11:56:36+00:00 ― 10 min lire

Apprentissage automatique L'essor du désapprentissage en apprentissage automatique

Explorer l'importance des méthodes de désapprentissage dans l'apprentissage automatique moderne.

2025-07-29T06:16:54+00:00 ― 6 min lire

Apprentissage automatique Améliorer les standards de recherche en apprentissage par renforcement multi-agent hors ligne

Examiner les problèmes clés en MARL hors ligne et proposer des solutions standardisées.

2025-07-29T05:53:12+00:00 ― 7 min lire

Informatique neuronale et évolutive Comprendre la Programmation Génétique Cartésienne : Une Approche Flexible

Apprends à connaître le CGP, sa fonction, ses avantages, ses applications et ses défis en programmation.

2025-07-29T05:37:24+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la génération d'images et de textes

Un nouveau jeu de données améliore la cohérence dans les séquences image-texte pour une création de contenu efficace.

2025-07-29T01:32:30+00:00 ― 7 min lire

Calcul et langage Évaluer les LLMs avec le nouveau benchmark SciEx

SciEx révèle les forces et les défis des LLMs dans l'évaluation scientifique.

2025-07-29T00:53:00+00:00 ― 8 min lire

Calcul et langage Faire avancer l'IA pour les langues de l'Asie du Sud-Est

SEACrowd vise à améliorer la représentation de l'IA pour les langues et les cultures d'Asie du Sud-Est.

2025-07-28T21:03:54+00:00 ― 9 min lire

Intelligence artificielle Tester des modèles de langue avec plusieurs problèmes

Une étude évalue les modèles de langage sur leur capacité à gérer plusieurs tâches en même temps.

2025-07-28T14:05:12+00:00 ― 10 min lire

Calcul et langage Évaluation des grands modèles de langage avec du texte structuré

Un nouveau benchmark teste les capacités des LLM avec des formats de données structurées.

2025-07-28T12:22:30+00:00 ― 8 min lire

Multimédia Évaluer la qualité des cours en ligne avec VCEval

VCEval propose un moyen automatisé d'évaluer l'efficacité des cours en ligne.

2025-07-28T10:39:48+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Nouveau standard pour les modèles vidéo-langage

Un nouveau benchmark vise la compositionnalité dans la compréhension vidéo et les modèles de langage.

2025-07-28T04:52:12+00:00 ― 7 min lire

Apprentissage automatique Faire avancer les normes d'évaluation des modèles de langage

Une nouvelle méthode améliore les tests pour les modèles de langage en utilisant des données réelles des utilisateurs.

2025-07-27T21:06:06+00:00 ― 7 min lire

Calcul et langage Présentation de la famille de modèles Nemotron-4 340B

La famille Nemotron-4 340B propose des modèles puissants pour des applications diverses et la génération de données synthétiques.

2025-07-27T18:43:54+00:00 ― 10 min lire

Calcul et langage Compétence culturelle dans les modèles linguistiques : une étude

Évaluer comment les modèles de langue gèrent les indices culturels dans des tâches réelles.

2025-07-27T16:53:18+00:00 ― 10 min lire