Utiliser l'IA pour améliorer comment on recrée le son dans différents environnements.
― 7 min lire
La science de pointe expliquée simplement
Utiliser l'IA pour améliorer comment on recrée le son dans différents environnements.
― 7 min lire
Une nouvelle méthode améliore la reconnaissance vocale en utilisant moins d'étiquettes et de ressources.
― 8 min lire
De nouvelles méthodes améliorent le lien entre les descriptions textuelles et les événements sonores.
― 9 min lire
Des méthodes innovantes améliorent la façon dont les robots traitent la direction du son en mouvement.
― 7 min lire
Apprends-en sur le beamforming à valeurs réelles et ses avantages pour les réseaux de microphones.
― 7 min lire
Une nouvelle approche pour la génération de discours petite, efficace et qui sonne naturel.
― 12 min lire
MusicAOG simplifie la création et la compréhension de la musique grâce à une représentation graphique innovante.
― 8 min lire
Un nouveau cadre pour combiner des réseaux de microphones sphériques et de haut-parleurs dans les études sonores.
― 7 min lire
Un nouveau cadre pour améliorer la détection des sons dans les robots humanoïdes grâce à la conception de réseaux de microphones.
― 10 min lire
Découvre comment les systèmes MIMO améliorent l'analyse sonore dans différents environnements.
― 9 min lire
De nouvelles techniques améliorent l'estimation de la direction du son pour différents réglages audio.
― 6 min lire
Des recherches montrent des astuces pour ajuster le son dans les pièces afin d'améliorer la clarté.
― 5 min lire
Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.
― 8 min lire
Les élastomères diélectriques convertissent l'énergie électrique en mouvement mécanique, offrant des applications diverses.
― 9 min lire
Les transcriptions ASR avec des erreurs peuvent aider à identifier la maladie d'Alzheimer plus précisément.
― 10 min lire
ELLA-V améliore la qualité et le contrôle de la synthèse vocale, surpassant les modèles précédents.
― 7 min lire
Une nouvelle approche améliore la précision de détection des cris d'animaux sans seuils arbitraires.
― 8 min lire
Un nouveau modèle intègre l'audio et le texte pour une meilleure classification de la parole.
― 8 min lire
Une nouvelle initiative pour améliorer la technologie de transcription pour les réunions dans les grandes salles.
― 9 min lire
De nouvelles méthodes améliorent la précision dans la reconnaissance vocale brouillée en utilisant de grands modèles de langue.
― 8 min lire
Analyser les sons des poules aide à améliorer leur santé et la productivité de la ferme.
― 10 min lire
Une méthode pour aider les malvoyants à reconnaître des sons en réalité mixte.
― 6 min lire
Cet article parle des solutions pour les applications de parole dans les langues avec peu de données transcrites.
― 8 min lire
Des chercheurs combinent des méthodes génératives et discriminatives pour améliorer la classification sonore.
― 7 min lire
Un nouveau modèle améliore la sécurité de l'identification vocale et résiste à la contrefaçon vocale.
― 7 min lire
Un aperçu de l'attention adaptative gaussienne pour améliorer les performances de l'IA.
― 8 min lire
Des recherches montrent que l'apprentissage profond améliore notre compréhension du rythme de la langue.
― 8 min lire
CoAVT intègre des données audio, visuelles et textuelles pour une meilleure compréhension.
― 9 min lire
E-SHARC améliore l'identification des locuteurs dans différents environnements audio.
― 7 min lire
Un nouveau système génère de la musique pour exprimer la joie et la tristesse.
― 7 min lire
Examiner les dangers et les préoccupations éthiques liés à la génération de la parole synthétique.
― 7 min lire
Un guide pour comprendre la similitude musicale dans les modèles génératifs.
― 11 min lire
Une étude sur la synthèse sonore et son évaluation dans des environnements contrôlés.
― 6 min lire
Une nouvelle méthode améliore la précision pour localiser des sources de son en mouvement en utilisant des réseaux de microphones.
― 8 min lire
PAM propose une nouvelle façon de mesurer la qualité audio sans avoir besoin d'enregistrements de référence.
― 8 min lire
Une méthode améliore la clarté de la parole dans des environnements bruyants sans données d'entraînement claires.
― 8 min lire
Audio Flamingo excelle à écouter, discuter et s'adapter à de nouvelles tâches audio.
― 7 min lire
Un nouveau modèle améliore la compréhension de l'audio spatial par les machines.
― 6 min lire
Un nouveau modèle améliore l'efficacité de la conversion de la parole en texte dans les applications en temps réel.
― 8 min lire
De nouvelles méthodes améliorent la reconnaissance vocale pour les langues sous-représentées en utilisant des données de langues similaires.
― 7 min lire