Explore des données sonores de 41 instruments de musique avec des enregistrements détaillés.
― 7 min lire
La science de pointe expliquée simplement
Explore des données sonores de 41 instruments de musique avec des enregistrements détaillés.
― 7 min lire
Recherche sur l'amélioration des embeddings acoustiques des mots avec compréhension sémantique et données multilingues.
― 8 min lire
Les nouvelles technologies améliorent la communication pour les personnes avec des troubles de la parole.
― 7 min lire
Un nouveau système combine transcription et traduction pour une meilleure communication.
― 6 min lire
Whisper-AT combine la reconnaissance vocale et le marquage audio pour de meilleures performances.
― 7 min lire
Une nouvelle approche qui combine la parole avec des modèles de langage pour une traduction améliorée.
― 6 min lire
Une nouvelle méthode améliore la précision pour transformer l'audio de piano en partitions.
― 5 min lire
Cet article parle des besoins et des défis dans la technologie audio générative.
― 7 min lire
De nouvelles méthodes utilisent les sons de la toux et des données de santé pour mieux détecter la tuberculose.
― 7 min lire
Cette étude examine comment les caractéristiques vocales évoluent chez les patients atteints de cancer de la bouche après le traitement.
― 7 min lire
Une nouvelle méthode pour changer le timbre musical en utilisant des techniques avancées d'apprentissage machine.
― 6 min lire
De nouvelles méthodes améliorent la précision de la reconnaissance vocale, en s'attaquant aux erreurs courantes de transcription.
― 6 min lire
Une étude sur l'amélioration de la reproduction sonore vocale grâce à des techniques de synthèse avancées.
― 7 min lire
VampNet transforme le traitement de la musique grâce à des techniques de modélisation de jetons innovantes.
― 5 min lire
Technologie portable abordable pour les personnes malentendantes.
― 6 min lire
Un nouveau modèle améliore la précision du timing pour les paroles dans les applis musicales.
― 7 min lire
Un synthétiseur en ligne qui permet aux utilisateurs de créer de la musique avec des gestes simples.
― 5 min lire
Une étude sur le rôle de l'IA dans la création de musique metal progressive.
― 8 min lire
Un modèle qui crée des tablatures de guitare reflétant le style de guitaristes célèbres.
― 7 min lire
Explorer le potentiel de l'apprentissage auto-supervisé dans la recherche d'informations musicales.
― 8 min lire
Utiliser des signaux audio pour identifier les risques de santé respiratoire.
― 9 min lire
Une nouvelle méthode améliore la vitesse et la précision de la reconnaissance vocale tout en réduisant l'utilisation des ressources.
― 7 min lire
Cette étude améliore le suivi de la faune en utilisant des embeddings audio pour une meilleure classification des sons.
― 11 min lire
Urhythmic améliore la conversion vocale en se concentrant sur le rythme de la parole.
― 6 min lire
La recherche améliore les techniques de fingerstyle percussif pour les guitaristes en utilisant la récupération de son en temps réel.
― 10 min lire
Cet article explore un nouveau modèle pour l'identification de l'intention de discours et des slots.
― 8 min lire
Avec l'avancée de la technologie de clonage vocal, des méthodes de détection fiables sont super importantes.
― 8 min lire
Une nouvelle méthode améliore la reconnaissance vocale en utilisant seulement des données audio brutes.
― 7 min lire
Une étude améliore la reconnaissance vocale pour les personnes âgées, en utilisant des techniques innovantes.
― 7 min lire
BASS améliore le résumé des longs audios en traitant par blocs.
― 6 min lire
De nouvelles méthodes représentent des risques de sécurité sérieux pour la technologie de reconnaissance vocale.
― 8 min lire
ivrit.ai fournit des ressources essentielles pour améliorer la technologie ASR en hébreu.
― 8 min lire
Des techniques innovantes transforment la façon dont on traduit le langage parlé.
― 8 min lire
De nouvelles méthodes visent à cacher l'identité des intervenants tout en gardant la clarté de la parole.
― 7 min lire
Nouveau modèle améliore la vitesse de reconnaissance vocale et l'utilisation de la mémoire.
― 8 min lire
De nouvelles méthodes améliorent la reconnaissance vocale dans des domaines spécifiques sans avoir besoin de beaucoup de données.
― 8 min lire
Un nouveau jeu de données met en avant les interprétations créatives des pianistes de jazz sur des standards classiques.
― 5 min lire
De nouvelles méthodes améliorent la représentation sonore en réalité virtuelle et augmentée.
― 9 min lire
FlexiAST permet aux modèles de s'adapter efficacement à différentes tailles de patch audio.
― 7 min lire
Des chercheurs utilisent l'apprentissage automatique pour améliorer le diagnostic du cancer de la gorge grâce à l'analyse de la parole.
― 8 min lire