Un nouveau système de RA améliore la collaboration entre humains et robots grâce au contrôle du regard.
― 8 min lire
La science de pointe expliquée simplement
Un nouveau système de RA améliore la collaboration entre humains et robots grâce au contrôle du regard.
― 8 min lire
Une nouvelle méthode améliore la façon dont les robots apprennent des préférences humaines.
― 7 min lire
Une nouvelle méthode automatise la génération de concepts pour améliorer la transparence des décisions de l'IA.
― 8 min lire
L'IA est en train de transformer la façon dont la musique est composée et vécue.
― 8 min lire
La recherche vise à améliorer les modèles de mouvement des doigts pour un meilleur design robotique.
― 8 min lire
Une nouvelle méthode améliore la reconnaissance des émotions dans les conversations en utilisant plusieurs sources de données.
― 7 min lire
Une nouvelle méthode pour suivre les interactions sans modèles.
― 7 min lire
Cette recherche améliore la reconnaissance des gestes de la main grâce à l'électromyographie pour plus d'accessibilité.
― 7 min lire
De nouvelles méthodes améliorent la qualité de la synthèse vocale dans les systèmes TTS.
― 6 min lire
Cette étude examine comment les modèles mentaux des utilisateurs influencent leurs interactions avec des systèmes de dialogue orientés vers les tâches.
― 8 min lire
Cette étude présente un modèle pour analyser les réactions émotionnelles face au contenu vidéo.
― 8 min lire
Des chercheurs améliorent la reconnaissance des gestes en utilisant des techniques d'apprentissage innovantes.
― 8 min lire
Cet article parle des avantages de la fusion des systèmes de reconnaissance vocale et faciale.
― 6 min lire
Une nouvelle méthode simplifie l'alignement des modèles de langage avec les préférences humaines.
― 7 min lire
Un nouveau modèle améliore la reconnaissance vocale en combinant efficacement les entrées audio et visuelles.
― 6 min lire
Évaluer comment les LLM multimodaux peuvent contrôler des jeux vidéo Atari.
― 6 min lire
Une nouvelle méthode améliore l'estimation de pose 3D dans des environnements complexes.
― 8 min lire
Cette étude améliore la reconnaissance d'action en fusionnant des cartes de profondeur avec des images vidéo RGB.
― 7 min lire
Un nouveau cadre pour améliorer les modèles de langage grâce à des interactions utilisateur en temps réel.
― 8 min lire
Une nouvelle approche améliore la détection d'actions dans les vidéos en s'attaquant à l'effondrement de l'attention.
― 8 min lire
Une étude révèle l'impact des signaux verbaux et non verbaux dans les interactions des utilisateurs avec les assistants virtuels.
― 8 min lire
Un nouveau critère aide à évaluer les tokenizeurs de discours pour de meilleures performances.
― 8 min lire
Améliorer la façon dont les machines aident les utilisateurs grâce à de meilleures interactions et mesures de réponse.
― 6 min lire
De nouvelles méthodes améliorent la reconnaissance des expressions faciales en utilisant des techniques de calibration en une seule image.
― 6 min lire
TIM propose de nouvelles méthodes pour générer des interactions humaines réalistes en mouvement.
― 6 min lire
Une nouvelle approche améliore la précision de l'estimation du regard en utilisant plusieurs jeux de données.
― 8 min lire
Cet article présente une nouvelle méthode pour des systèmes de dialogue réalistes en utilisant des traits spécifiques aux utilisateurs.
― 6 min lire
Une nouvelle méthode intègre l'apport humain pour améliorer l'apprentissage OOD des modèles de machine learning.
― 9 min lire
Explorer l'intersection entre les retours humains et les systèmes multi-agents pour une meilleure collaboration.
― 7 min lire
Cette étude évalue à quel point les VLM peuvent comprendre les perspectives visuelles.
― 7 min lire
Un agent hybride pour le jeu Loup-Garou améliore l'interaction et le gameplay.
― 7 min lire
Une nouvelle méthode combine 2D et 3D pour des vidéos humaines réalistes.
― 8 min lire
Cette étude améliore la SER grâce à un meilleur prétraitement et des modèles d'attention efficaces.
― 6 min lire
Un nouveau cadre améliore la génération de mouvements pour les animations et les expériences virtuelles.
― 8 min lire
Explorer comment l'apprentissage des préférences améliore l'alignement des modèles de langage avec les attentes humaines.
― 11 min lire
Cette étude présente un modèle qui intègre le contexte pour mieux reconnaître les expressions faciales.
― 10 min lire
MVTN améliore la reconnaissance des gestes de la main grâce à des techniques multiscales innovantes.
― 6 min lire
Une nouvelle méthode combine le sens et le son pour une détection d’émotion améliorée dans la parole.
― 8 min lire
Des recherches montrent que les données EEG peuvent aider les réseaux de neurones artificiels à résister aux attaques adversariales.
― 6 min lire
Une nouvelle méthode améliore la capacité des agents à apprendre de leurs erreurs dans des environnements virtuels.
― 9 min lire