Derniers articles pour Étalon

Vision par ordinateur et reconnaissance des formes Améliorer l'adaptabilité de CLIP en vision par ordinateur

De nouvelles méthodes améliorent la performance de CLIP dans différents domaines visuels.

2025-07-09T12:16:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouveau benchmark améliore la compréhension vidéo-langue

Un nouveau repère améliore la compréhension des modèles sur les longues vidéos et le langage.

2025-07-09T01:29:06+00:00 ― 7 min lire

Calcul et langage Évaluer l'impact des agents web sur les tâches sur Internet

Cet article évalue l'efficacité des agents web dans la gestion de tâches en ligne complexes.

2025-07-09T00:10:06+00:00 ― 8 min lire

Architecture matérielle Améliorer la génération de code HDL avec des invites hiérarchiques

Une nouvelle méthode améliore l'efficacité des LLM pour créer des designs matériels complexes.

2025-07-08T15:05:00+00:00 ― 7 min lire

Calcul et langage Améliorer les benchmarks d'extraction d'informations ouvertes

Un nouveau critère vise à améliorer les évaluations des systèmes OIE pour des aperçus de performance plus précis.

2025-07-08T12:34:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées en imagerie hyperspectrale avec HyTAS

HyTAS simplifie la recherche de modèles de transformateurs en imagerie hyperspectrale.

2025-07-08T02:26:36+00:00 ― 10 min lire

Calcul et langage S'attaquer aux hallucinations dans les modèles de langage

Un nouveau benchmark évalue les LLMs pour leur précision factuelle.

2025-07-07T18:08:54+00:00 ― 7 min lire

Calcul et langage Le besoin de personnalisation dans les modèles d'IA

De nouvelles méthodes pour personnaliser les modèles de langage IA sont essentielles pour la diversité des utilisateurs.

2025-07-07T00:54:00+00:00 ― 8 min lire

Génomique Intégration des séquences d'ADN et des descriptions pour améliorer la prédiction de la fonction des gènes

Un nouveau jeu de données combine des séquences d'ADN et des descriptions de la fonction des enzymes pour améliorer les modèles prédictifs.

2025-07-06T21:54:09+00:00 ― 10 min lire

Apprentissage automatique Nouvelle méthode de référence pour évaluer les algorithmes d'apprentissage par renforcement

Une nouvelle approche améliore les comparaisons des algorithmes d'apprentissage par renforcement dans différents environnements.

2025-07-06T13:03:00+00:00 ― 9 min lire

Robotique Nouveau standard pour l'entraînement des robots à la maison

Un nouveau critère vise à améliorer l'entraînement des robots dans des environnements domestiques réalistes.

2025-07-06T07:31:12+00:00 ― 8 min lire

Calcul et langage Optimisation de l'évaluation des modèles de langage avec Metabench

Un nouveau cadre de référence améliore l'efficacité pour évaluer les modèles de langage.

2025-07-05T16:27:28+00:00 ― 7 min lire

Intelligence artificielle Évaluer les modèles de langue avec de nouvelles méthodes de benchmarking

Une nouvelle approche pour améliorer l'évaluation des tâches de codage pour les modèles de langage.

2025-07-05T07:49:12+00:00 ― 8 min lire

Calcul et langage Évaluation des repères pour les systèmes de texte à visualisation

La recherche examine l'efficacité des repères actuels dans les tâches de visualisation.

2025-07-05T07:17:36+00:00 ― 6 min lire

Génie logiciel Évaluation des défis de codage pour les modèles linguistiques

Un nouveau cadre évalue la difficulté des tâches de codage pour les grands modèles de langage.

2025-07-05T04:39:36+00:00 ― 11 min lire

Calcul et langage Évaluation du raisonnement logique dans les grands modèles de langage

Une étude évalue les compétences de raisonnement des grands modèles de langage avec des questions complexes.

2025-07-04T17:20:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer les modèles vision-langage avec UniBench

Un nouveau cadre pour évaluer efficacement les modèles vision-langage.

2025-06-30T16:33:42+00:00 ― 8 min lire

Apprentissage automatique Nouveau Referentiel pour la Détection d'Anomalies dans l'Apprentissage Fédéré

Présentation d'un outil pour évaluer les méthodes de détection d'anomalies non supervisées dans l'apprentissage fédéré.

2025-06-30T09:58:42+00:00 ― 9 min lire

Bioinformatique Évaluer les compétences de l'IA dans les protocoles biologiques

Évaluer les modèles d'IA pour leur capacité à suivre les procédures de labo.

2025-06-28T19:07:49+00:00 ― 8 min lire

Logique en informatique Avancées dans les techniques de comptage de modèles

Un aperçu des améliorations récentes dans les outils de comptage de modèles et leurs applications pratiques.

2025-06-28T16:14:24+00:00 ― 7 min lire

Calcul et langage Évaluation des modèles de reconnaissance des émotions dans la parole avec un nouveau benchmark

Un nouveau standard améliore l'évaluation des systèmes de reconnaissance des émotions dans la parole, toutes langues et émotions confondues.

2025-06-28T04:15:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluation des modèles 3D pour l'estimation de la pose des objets

Cet article examine l'efficacité des modèles 3D basés sur des images dans l'estimation de pose.

2025-06-27T11:55:54+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Évaluation des modèles de langage visuel à travers MuCR

De nouveaux repères testent le raisonnement causal de l'IA en utilisant seulement des images.

2025-06-27T08:46:18+00:00 ― 9 min lire

Apprentissage automatique Évaluer les grands modèles de langage pour une utilisation dans le monde réel

Une nouvelle approche pour évaluer les LLM avec des ensembles d'évaluation variés.

2025-06-26T22:53:48+00:00 ― 8 min lire

Calcul et langage Évaluation des agents de modèles linguistiques dans la recherche scientifique

Un nouveau critère évalue les agents de modèles linguistiques pour gérer l'analyse des données scientifiques.

2025-06-26T10:47:00+00:00 ― 10 min lire

Calcul et langage Repensons l'apprentissage des langues : LLMs vs. Humains

Une analyse des LLM et de leurs différences par rapport à l'acquisition du langage humain.

2025-06-26T08:48:30+00:00 ― 10 min lire

Dynamique des fluides Investigation de la génération de son par des cylindres oscillants dans des fluides

Étudier comment des cylindres en mouvement créent des ondes sonores dans les fluides pour des applications pratiques.

2025-06-26T05:24:09+00:00 ― 6 min lire

Intelligence artificielle Évaluation de l'apprentissage des règles dans les modèles de langage

Un nouveau repère évalue comment les LLM apprennent à travers les interactions.

2025-06-26T01:57:42+00:00 ― 6 min lire

Calcul et langage O-HuBERT : Un pas en avant dans la reconnaissance vocale

O-HuBERT améliore la reconnaissance vocale en séparant le contenu et l'information expressive.

2025-06-24T20:04:24+00:00 ― 7 min lire

Calcul et langage Nouveau repère pour la génération de texte dans l'énergie éolienne

Présentation de PermitQA, un benchmark pour évaluer les systèmes RAG dans l'énergie éolienne.

2025-06-24T13:37:18+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale en hindi avec du pseudo-labelling

Une nouvelle méthode améliore la reconnaissance vocale pour l'hindi en utilisant des techniques de pseudo-étiquetage.

2025-06-24T06:02:40+00:00 ― 6 min lire

Intelligence artificielle Nouveau repère pour évaluer la génération de code dans les LLMs

Un benchmark multi-domaine évalue les capacités de génération de code des LLM dans différents domaines.

2025-06-23T06:56:36+00:00 ― 8 min lire

Intelligence artificielle Évaluer la capacité de l'IA à comprendre des graphiques trompeurs

Une nouvelle méthode teste comment l'IA interprète des graphiques trompeurs.

2025-06-22T02:38:06+00:00 ― 7 min lire

Génie logiciel Évaluation de la résolution des problèmes Java : Une nouvelle référence

Un nouveau projet de référence vise à évaluer les capacités de résolution des problèmes Java.

2025-06-22T01:27:00+00:00 ― 7 min lire

Intelligence artificielle Équilibrer la sécurité et l'utilité dans les modèles linguistiques

Une nouvelle approche simplifie la sécurité et l'utilité dans l'entraînement des modèles de langage.

2025-06-21T13:59:42+00:00 ― 12 min lire

Multimédia Faire progresser les systèmes d'interaction multimodaux

Améliorer la façon dont les machines aident les utilisateurs grâce à de meilleures interactions et mesures de réponse.

2025-06-19T23:48:42+00:00 ― 6 min lire

Son Évaluer de gros modèles de langage en musicologie

Cette étude examine l'efficacité des LLMs en musicologie et leur fiabilité.

2025-06-19T15:55:20+00:00 ― 7 min lire

Informatique distribuée, parallèle et en grappes Comprendre la suite de référence JUPITER en HPC

Un outil complet pour évaluer les systèmes de calcul haute performance.

2025-06-19T14:12:00+00:00 ― 8 min lire

Langages de programmation Wasm-R3 : Benchmarking efficace pour les applications WebAssembly

Un système pour enregistrer et rejouer des actions dans des applis WebAssembly.

2025-06-18T22:08:12+00:00 ― 8 min lire

Architecture matérielle Avancées dans le partitionnement de conception VLSI utilisant des GNN

Exploration des techniques d'apprentissage automatique pour un partitionnement efficace de la conception VLSI.

2025-06-18T13:50:30+00:00 ― 7 min lire