Derniers articles pour Interaction Humain-Machine

Calcul et langage Amélioration des modèles linguistiques grâce à une supervision fiable

Une nouvelle approche pour améliorer la généralisation faible-forte dans les modèles de langage.

2025-07-23T07:25:24+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Le rôle de l'IA dans l'efficacité de l'annotation d'images

Découvrez comment l'IA transforme l'annotation d'images pour plus de précision et de rapidité.

2025-07-23T02:56:48+00:00 ― 7 min lire

Apprentissage automatique Intégrer la vision et le langage dans le cerveau

Cette étude montre comment le cerveau combine les infos visuelles et linguistiques.

2025-07-22T21:29:48+00:00 ― 5 min lire

Calcul et langage Faire progresser le raisonnement machine avec des données visuelles

Améliorer la façon dont les machines répondent aux questions visuelles grâce à un raisonnement structuré.

2025-07-22T20:21:48+00:00 ― 8 min lire

Calcul et langage L'impact de la reformulation sur les modèles linguistiques

Cet article examine comment le choix des mots affecte la performance des modèles de langage.

2025-07-22T19:58:06+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluer l'apprentissage multimodal dans les modèles de langue

Cette étude examine comment les données visuelles et textuelles influencent la performance des modèles.

2025-07-22T07:03:54+00:00 ― 9 min lire

Intelligence artificielle Évaluer le raisonnement spatial dans les modèles de langage

Voici GRASP, un benchmark pour évaluer le raisonnement spatial dans les modèles de langage.

2025-07-21T23:49:24+00:00 ― 9 min lire

Intelligence artificielle Présentation de CRAB : Un nouveau standard pour les modèles de langage

CRAB améliore les tests pour les modèles de langage dans des environnements réels.

2025-07-21T18:41:18+00:00 ― 8 min lire

Interaction homme-machine Présentation de LEXI : Un outil pour la recherche HAI

LEXI simplifie la recherche sur les interactions humain-agent avec les Grands Modèles de Langage.

2025-07-21T17:53:54+00:00 ― 10 min lire

Traitement de l'audio et de la parole Amélioration de la synthèse vocale avec le modélisation par sous-centre

Améliorer la synthèse vocale pour une génération de voix plus naturelle et expressive.

2025-07-21T03:23:35+00:00 ― 6 min lire

Interaction homme-machine Améliorer le contrôle des utilisateurs dans l'analyse de données IA

Deux systèmes améliorent l'accompagnement des utilisateurs et la vérification dans l'analyse des données générées par l'IA.

2025-07-21T02:21:42+00:00 ― 8 min lire

Calcul et langage Faire avancer la reconnaissance des émotions dans les conversations

Un nouveau cadre, BiosERC, améliore la reconnaissance des émotions en prenant en compte les traits des interlocuteurs.

2025-07-21T01:46:25+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconnaissance des expressions faciales avec le modèle GCF

Le modèle GCF améliore la précision de la reconnaissance des expressions faciales grâce à des techniques de deep learning innovantes.

2025-07-20T20:42:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode améliore l'anticipation des actions dans la technologie

Une nouvelle approche améliore la prédiction des actions futures en utilisant des insights visuels et sémantiques.

2025-07-20T19:15:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la génération de mouvements humains avec des perspectives perceptuelles

Une nouvelle méthode améliore le réalisme des mouvements humains grâce aux retours humains.

2025-07-20T18:19:48+00:00 ― 9 min lire

Interaction homme-machine Une nouvelle approche pour la personnalisation de l'interface utilisateur

L'auto-calibration simplifie l'entrée du code PIN et renforce la sécurité sans configurations compliquées.

2025-07-20T18:04:00+00:00 ― 7 min lire

Calcul et langage Améliorer l'empathie de l'IA grâce à une sélection de données efficace

Une nouvelle méthode améliore les réponses empathiques de l'IA en utilisant des données de qualité.

2025-07-20T11:44:48+00:00 ― 8 min lire

Calcul et langage Améliorer les modèles de langue grâce à la génération de dialogues multi-tours

Une méthode pour améliorer les modèles de langue en créant des dialogues captivants sur plusieurs tours.

2025-07-20T05:49:18+00:00 ― 8 min lire

Son Faire avancer le repérage de mots-clés en quelques exemples avec l'entraînement mixte

Cette étude examine le Mix-Training pour la détection de mots-clés dans des conditions de parole bruyante.

2025-07-19T16:39:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Comparaison du traitement d'image : Humains vs. systèmes d'IA

Une étude révèle des différences clés dans la manière dont les humains et l'IA représentent les images.

2025-07-19T09:51:21+00:00 ― 8 min lire

Calcul et langage Repenser les méthodes d'évaluation pour les chatbots

Les critères d'évaluation actuels ne tiennent pas compte des capacités modernes des chatbots.

2025-07-19T05:35:42+00:00 ― 7 min lire

Calcul et langage Aligner les évaluations de l'IA avec les préférences humaines

L'étude révèle le biais dans les outils d'évaluation de l'IA qui favorisent les réponses plus longues.

2025-07-19T00:11:48+00:00 ― 6 min lire

Intelligence artificielle Évaluation des LLM dans les jeux de prise de décision stratégique

Cette étude évalue les biais dans les LLM lors de jeux stratégiques comme Stag Hunt.

2025-07-18T14:11:24+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Prédire les interactions d'objets avec STAformer

STAformer améliore la prévision d'actions dans les vidéos grâce à des techniques basées sur l'attention.

2025-07-18T12:36:36+00:00 ― 7 min lire

Intelligence artificielle Évaluation des modèles fondamentaux multimodaux dans la planification de tâches

Évaluer comment les modèles se débrouillent dans la planification de tâches dans le monde réel en utilisant un nouveau cadre.

2025-07-18T05:45:48+00:00 ― 7 min lire

Robotique Améliorer l'interaction humain-robot grâce à la détection d'erreurs

Un défi pour améliorer la compréhension des interactions humaines par les robots.

2025-07-17T10:00:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'estimation de pose humaine en 3D avec V-VIPE

V-VIPE améliore l'estimation de pose 3D à partir d'images 2D, en surmontant les défis d'angle.

2025-07-16T19:08:06+00:00 ― 10 min lire

Intelligence artificielle Les modèles de langage visuel galèrent avec des tâches visuelles basiques

Des recherches montrent que les VLMs ont une mauvaise précision dans des tâches visuelles simples comparées aux humains.

2025-07-16T08:20:18+00:00 ― 6 min lire

Interaction homme-machine Améliorer la présence en réalité virtuelle grâce à l'interaction avec les avatars

Cette étude examine les méthodes d'interaction avec les avatars pour améliorer les expériences en VR.

2025-07-16T01:37:24+00:00 ― 9 min lire

Traitement de l'audio et de la parole Qwen2-Audio : Une nouvelle voix pour la technologie

Un modèle vocal qui transforme l'interaction audio avec la technologie.

2025-07-16T00:18:55+00:00 ― 7 min lire

Robotique Apprendre aux robots à interagir naturellement avec les humains

Une nouvelle méthode aide les robots à apprendre en observant les interactions humaines.

2025-07-15T19:34:00+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la recherche d'images grâce à la collaboration humain-IA

Une nouvelle méthode améliore la recherche d'images en intégrant les corrections humaines dans les systèmes d'IA.

2025-07-15T11:24:12+00:00 ― 10 min lire

Intelligence artificielle Faire avancer les agents interactifs avec un langage ancré

Une étude sur comment améliorer la capacité de l'IA à suivre des instructions en langage naturel.

2025-07-15T11:00:30+00:00 ― 10 min lire

Interaction homme-machine Défis pour identifier l'IA dans les conversations

Une étude révèle les galères pour les humains et l'IA à se reconnaître.

2025-07-15T10:05:12+00:00 ― 8 min lire

Robotique Stratégies sonores pour le contrôle des robots dans des zones dangereuses

Une étude évalue la conception sonore pour l'opération de robots à distance dans des environnements dangereux.

2025-07-14T17:14:00+00:00 ― 9 min lire

Apprentissage automatique Optimiser le feedback humain dans les modèles de langage

Une nouvelle méthode améliore la collecte de feedback pour les modèles de langue, ce qui fait gagner du temps et de l'argent.

2025-07-14T14:54:36+00:00 ― 9 min lire

Traitement de l'audio et de la parole MSceneSpeech : Faire avancer la synthèse vocale en mandarin

Un nouveau jeu de données améliore la parole des machines pour le mandarin, visant une expression naturelle.

2025-07-14T09:26:55+00:00 ― 7 min lire

Calcul et langage Améliorer les modèles de langage avec l'optimisation directe des préférences

Des chercheurs développent des méthodes pour mieux aligner les modèles de langage avec les préférences humaines.

2025-07-14T07:29:24+00:00 ― 9 min lire

Calcul et langage Évaluer la résilience des modèles de langage face aux erreurs de texte

Analyser comment les LLM gèrent les inexactitudes dans le texte dans des situations réelles.

2025-07-14T05:30:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la récupération d'actions basées sur des images

Nouveau modèle améliore la récupération d'actions à partir d'images en utilisant des personnes, des objets et le contexte.

2025-07-14T02:37:06+00:00 ― 6 min lire