Un modèle vocal qui transforme l'interaction audio avec la technologie.
― 7 min lire
La science de pointe expliquée simplement
Un modèle vocal qui transforme l'interaction audio avec la technologie.
― 7 min lire
Un nouveau jeu de données vise à améliorer la capture de la voix avec des capteurs de conduction corporelle.
― 7 min lire
La recherche présente de nouvelles méthodes pour évaluer les systèmes de reconnaissance vocale en polonais.
― 8 min lire
Des chercheurs améliorent le décodage de la parole en utilisant l'EEG pour aider les personnes ayant des troubles de la parole.
― 9 min lire
Cette étude évalue les systèmes de reconnaissance vocale en utilisant différentes langues pour l'histoire orale.
― 7 min lire
OpenOmni crée des outils flexibles pour créer et tester des agents conversationnels.
― 10 min lire
La recherche se concentre sur une meilleure synthèse des conversations parlées dans différentes langues.
― 8 min lire
NEST propose une approche plus rapide et efficace pour les tâches de parole auto-supervisées.
― 7 min lire
La recherche se concentre sur la prédiction des erreurs dans la reconnaissance vocale pour une meilleure précision.
― 7 min lire
La recherche améliore la reconnaissance vocale pour le hindi avec des accents divers.
― 6 min lire
Une nouvelle méthode améliore la précision de la reconnaissance vocale dans plusieurs langues.
― 7 min lire
Des chercheurs ont créé LibriheavyMix pour améliorer la reconnaissance vocale dans des environnements bruyants.
― 6 min lire
Cette recherche analyse la performance de Mamba dans les tâches de parole, en mettant l'accent sur la reconstruction et la reconnaissance des sons.
― 7 min lire
Des chercheurs ont développé un jeu de données pour améliorer les techniques de reconnaissance et d'analyse de la parole.
― 8 min lire
Efforts pour améliorer la technologie de la parole pour la langue Faetar, qui est sous-resources.
― 6 min lire
Une étude sur l'utilisation des modèles de langue pour corriger les erreurs dans les systèmes de reconnaissance vocale.
― 7 min lire
Une nouvelle méthode qui améliore la reconnaissance vocale tout en garantissant la confidentialité des données.
― 6 min lire
Des recherches montrent les galères avec la reconnaissance vocale des transmissions radio de la police.
― 9 min lire
WeHelp propose un soutien robotique pour améliorer les activités quotidiennes des utilisateurs de fauteuils roulants.
― 7 min lire
Cette étude aborde les défis des modèles audio pour les langues à faibles ressources.
― 7 min lire
EVA combine des signaux audio et visuels pour une meilleure précision de reconnaissance vocale.
― 5 min lire
La recherche évalue les liens entre les modèles de parole et de langage pour une meilleure reconnaissance et traduction.
― 7 min lire
Une méthode pour améliorer la reconnaissance vocale automatique en mélangeant des listes de mots-clés avec des modèles de langue.
― 6 min lire
Apprends à entraîner des modèles de parole de manière efficace avec moins de ressources étiquetées.
― 9 min lire
EMOVA améliore l'interaction humain-ordinateur grâce à l'expression émotionnelle.
― 6 min lire
Des outils d'IA comme NYCUKA visent à améliorer le soutien à la santé mentale des étudiants de manière efficace.
― 8 min lire
Des découvertes récentes montrent que les capteurs de pression peuvent être utilisés pour espionner.
― 5 min lire
Cette étude analyse comment l'audio, la vidéo et le texte fonctionnent ensemble dans la reconnaissance vocale.
― 9 min lire
De nouvelles méthodes améliorent les outils de communication pour les personnes ayant des problèmes de parole.
― 8 min lire
Examiner les forces, faiblesses et l'avenir de SLAM-ASR dans la reconnaissance vocale.
― 6 min lire
Un projet améliore la reconnaissance vocale pour la langue Malasar en utilisant des ressources tamoules.
― 6 min lire
NeKo améliore la communication entre machines en corrigeant les erreurs de parole, de traduction et de texte.
― 8 min lire
Créer un modèle d'IA pour des conversations naturelles en mandarin taïwanais.
― 6 min lire
Mamba améliore la reconnaissance vocale avec rapidité et précision, redéfinissant l'interaction avec les appareils.
― 5 min lire
Apprends comment la technologie interprète nos voix grâce à l'analyse des ondes sonores.
― 7 min lire
Tiny-Align améliore les assistants vocaux pour une meilleure interaction personnelle sur les petits appareils.
― 7 min lire
Les chercheurs améliorent la reconnaissance automatique de la parole en utilisant la supervision de paraphrase pour mieux comprendre.
― 6 min lire
De nouvelles méthodes améliorent la façon dont les machines reconnaissent le langage parlé.
― 10 min lire
Un outil de reconnaissance vocale transforme facilement les maths parlées en LaTeX.
― 7 min lire
La technologie de reconnaissance vocale améliore la reconnaissance des chiffres, surtout dans des environnements bruyants.
― 6 min lire