Derniers articles pour Interaction Humain-Machine

Calcul et langage Comment les modèles de reconnaissance vocale gèrent les changements de son

Une étude sur comment les machines s'adaptent aux changements phonologiques dans la parole.

2025-07-25T20:31:00+00:00 ― 8 min lire

Calcul et langage Évaluation des modèles de langue multilingues dans les langues indiques

Une étude complète sur la performance des modèles linguistiques dans 10 langues indiennes.

2025-07-25T17:37:12+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la technologie de reconnaissance des gestes de la main

Un nouveau système améliore la reconnaissance des gestes de la main en temps réel pour diverses applications.

2025-07-25T16:34:00+00:00 ― 9 min lire

Intelligence artificielle Évaluer l'empathie dans les modèles de langage avec GIEBench

GIEBench évalue les réponses empathiques des LLM en se basant sur des identités de groupe diverses.

2025-07-25T15:38:42+00:00 ― 9 min lire

Calcul et langage Évaluer la performance du modèle dans la compréhension des dépendances de plan

Des recherches montrent que les modèles galèrent avec les dépendances d'étapes dans les recettes de cuisine.

2025-07-25T11:41:42+00:00 ― 7 min lire

Calcul et langage Comprendre la prise de décision humaine dans l'IA

Un aperçu de comment les modèles d'IA interprètent les choix humains et de la nécessité d'améliorations.

2025-07-25T00:14:24+00:00 ― 8 min lire

Apprentissage automatique Réévaluer les méthodes de feedback dans la génération d'images

Enquête sur les retours détaillés pour les modèles texte-image et ses implications pratiques.

2025-07-24T23:34:54+00:00 ― 8 min lire

Apprentissage automatique Utiliser des modèles de langage pour définir des récompenses pour les agents RL

Une nouvelle méthode pour définir des récompenses pour les agents d'apprentissage par renforcement en utilisant des modèles de langage.

2025-07-24T22:23:48+00:00 ― 9 min lire

Calcul et langage Évaluation des modèles multimodaux en matière de littératie visuelle

Une étude évalue comment les MLLM comprennent les données visuelles et leur performance par rapport aux humains.

2025-07-24T16:59:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Reconstruction des interactions main-visage en 3D à partir d'images uniques

Une nouvelle méthode améliore la reconstruction des interactions main-visage pour la réalité augmentée et la réalité virtuelle.

2025-07-24T15:25:06+00:00 ― 8 min lire

Calcul et langage Auto-jeu dans les modèles de langage : Une nouvelle approche

L'auto-jeu peut-il améliorer les performances des modèles linguistiques dans des contextes coopératifs ?

2025-07-24T04:13:36+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Présentation de GeoHOI : Un nouveau modèle pour la détection des HOI

GeoHOI améliore la détection des interactions homme-objet en utilisant des caractéristiques géométriques pour une précision accrue.

2025-07-24T02:07:12+00:00 ― 7 min lire

Calcul et langage Redéfinir la classification de texte à l'ère de l'IA

Une nouvelle approche pour classer les textes générés par les humains et les machines de manière plus efficace.

2025-07-23T22:10:12+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode pour la génération de scènes 3D réalistes

Présentation d'une méthode pour créer des scènes 3D réalistes pour la réalité virtuelle et le design.

2025-07-23T20:35:24+00:00 ― 9 min lire

Apprentissage automatique Avancées dans la reconnaissance des émotions pour les conversations

Nouveau modèle améliore la précision dans la détection des émotions pendant les échanges oraux.

2025-07-23T17:17:54+00:00 ― 7 min lire

Calcul et langage Avancées dans la génération de texte de longue forme pour les modèles d'IA

De nouvelles méthodes d'entraînement améliorent la capacité des modèles linguistiques à créer des textes longs et détaillés.

2025-07-23T12:25:36+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Présentation de CORE4D : un ensemble de données complet pour les interactions humain-objet

CORE4D offre des perspectives uniques sur la façon dont les gens réorganisent ensemble les objets ménagers.

2025-07-23T12:09:48+00:00 ― 7 min lire

Calcul et langage Repenser les explications dans les systèmes d'IA

Cette étude examine comment les explications influencent les perceptions des utilisateurs sur les capacités de l'IA.

2025-07-23T09:00:12+00:00 ― 6 min lire

Interaction homme-machine Avancées dans le décodage EEG d'imagerie motrice avec EDPNet

EDPNet améliore le décodage de l'imagerie motrice pour les interfaces cerveau-ordinateur.

2025-07-23T08:50:05+00:00 ― 7 min lire

Calcul et langage S'attaquer à l'ambiguïté dans les requêtes de base de données

Un nouveau référentiel évalue comment les ordinateurs traitent les questions ambiguës.

2025-07-23T07:49:06+00:00 ― 8 min lire

Calcul et langage Amélioration des modèles linguistiques grâce à une supervision fiable

Une nouvelle approche pour améliorer la généralisation faible-forte dans les modèles de langage.

2025-07-23T07:25:24+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Le rôle de l'IA dans l'efficacité de l'annotation d'images

Découvrez comment l'IA transforme l'annotation d'images pour plus de précision et de rapidité.

2025-07-23T02:56:48+00:00 ― 7 min lire

Apprentissage automatique Intégrer la vision et le langage dans le cerveau

Cette étude montre comment le cerveau combine les infos visuelles et linguistiques.

2025-07-22T21:29:48+00:00 ― 5 min lire

Calcul et langage Faire progresser le raisonnement machine avec des données visuelles

Améliorer la façon dont les machines répondent aux questions visuelles grâce à un raisonnement structuré.

2025-07-22T20:21:48+00:00 ― 8 min lire

Calcul et langage L'impact de la reformulation sur les modèles linguistiques

Cet article examine comment le choix des mots affecte la performance des modèles de langage.

2025-07-22T19:58:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'apprentissage multimodal dans les modèles de langue

Cette étude examine comment les données visuelles et textuelles influencent la performance des modèles.

2025-07-22T07:03:54+00:00 ― 9 min lire

Intelligence artificielle Évaluer le raisonnement spatial dans les modèles de langage

Voici GRASP, un benchmark pour évaluer le raisonnement spatial dans les modèles de langage.

2025-07-21T23:49:24+00:00 ― 9 min lire

Intelligence artificielle Présentation de CRAB : Un nouveau standard pour les modèles de langage

CRAB améliore les tests pour les modèles de langage dans des environnements réels.

2025-07-21T18:41:18+00:00 ― 8 min lire

Interaction homme-machine Présentation de LEXI : Un outil pour la recherche HAI

LEXI simplifie la recherche sur les interactions humain-agent avec les Grands Modèles de Langage.

2025-07-21T17:53:54+00:00 ― 10 min lire

Traitement de l'audio et de la parole Amélioration de la synthèse vocale avec le modélisation par sous-centre

Améliorer la synthèse vocale pour une génération de voix plus naturelle et expressive.

2025-07-21T03:23:35+00:00 ― 6 min lire

Interaction homme-machine Améliorer le contrôle des utilisateurs dans l'analyse de données IA

Deux systèmes améliorent l'accompagnement des utilisateurs et la vérification dans l'analyse des données générées par l'IA.

2025-07-21T02:21:42+00:00 ― 8 min lire

Calcul et langage Faire avancer la reconnaissance des émotions dans les conversations

Un nouveau cadre, BiosERC, améliore la reconnaissance des émotions en prenant en compte les traits des interlocuteurs.

2025-07-21T01:46:25+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconnaissance des expressions faciales avec le modèle GCF

Le modèle GCF améliore la précision de la reconnaissance des expressions faciales grâce à des techniques de deep learning innovantes.

2025-07-20T20:42:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode améliore l'anticipation des actions dans la technologie

Une nouvelle approche améliore la prédiction des actions futures en utilisant des insights visuels et sémantiques.

2025-07-20T19:15:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la génération de mouvements humains avec des perspectives perceptuelles

Une nouvelle méthode améliore le réalisme des mouvements humains grâce aux retours humains.

2025-07-20T18:19:48+00:00 ― 9 min lire

Interaction homme-machine Une nouvelle approche pour la personnalisation de l'interface utilisateur

L'auto-calibration simplifie l'entrée du code PIN et renforce la sécurité sans configurations compliquées.

2025-07-20T18:04:00+00:00 ― 7 min lire

Calcul et langage Améliorer l'empathie de l'IA grâce à une sélection de données efficace

Une nouvelle méthode améliore les réponses empathiques de l'IA en utilisant des données de qualité.

2025-07-20T11:44:48+00:00 ― 8 min lire

Calcul et langage Améliorer les modèles de langue grâce à la génération de dialogues multi-tours

Une méthode pour améliorer les modèles de langue en créant des dialogues captivants sur plusieurs tours.

2025-07-20T05:49:18+00:00 ― 8 min lire

Son Faire avancer le repérage de mots-clés en quelques exemples avec l'entraînement mixte

Cette étude examine le Mix-Training pour la détection de mots-clés dans des conditions de parole bruyante.

2025-07-19T16:39:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Comparaison du traitement d'image : Humains vs. systèmes d'IA

Une étude révèle des différences clés dans la manière dont les humains et l'IA représentent les images.

2025-07-19T09:51:21+00:00 ― 8 min lire