Cette étude examine comment l'IA évalue et décrit les sons par rapport aux humains.
― 8 min lire
La science de pointe expliquée simplement
Cette étude examine comment l'IA évalue et décrit les sons par rapport aux humains.
― 8 min lire
Derniers articles
Derniers articles
Un ensemble de données audio complet vise à améliorer les méthodes de dé-réverbération pour un son plus clair.
― 7 min lire
DAS-N2N utilise l'apprentissage automatique pour améliorer la collecte de données sismiques en réduisant le bruit.
― 9 min lire
De nouvelles techniques améliorent la précision de la reconnaissance vocale en streaming et hors streaming.
― 6 min lire
Cette étude montre comment la tokenisation par sous-mots améliore la qualité et l'efficacité de la génération musicale.
― 8 min lire
Examiner comment les attaques adversariales affectent les systèmes de reconnaissance vocale et les méthodes pour améliorer la transférabilité.
― 7 min lire
Explorer des méthodes modernes pour isoler des signaux mélangés dans le traitement audio et d'image.
― 7 min lire
CB-Conformer améliore la reconnaissance vocale pour les mots biaisés avec des techniques innovantes.
― 6 min lire
Explore les défis de sécurité et de vie privée de la technologie des assistants vocaux.
― 7 min lire
Améliorer les modèles de reconnaissance vocale pour le suisse allemand en utilisant des techniques avancées et des ensembles de données.
― 6 min lire
Une étude explore comment les données mobiles aident à comprendre les hallucinations verbales auditives.
― 10 min lire
Une nouvelle méthode améliore les défenses contre les attaques audio adversariales dans les systèmes de reconnaissance vocale.
― 7 min lire
La recherche se concentre sur des modèles efficaces pour le repérage de mots-clés en utilisant des réseaux slimables.
― 6 min lire
CLaMP combine la musique et la langue pour la classification et la recherche automatiques de musique.
― 7 min lire
Une méthode mathématique pour évaluer la beauté des performances musicales.
― 6 min lire
Découvre comment les modèles pré-entraînés améliorent la technologie de reconnaissance des émotions dans la voix.
― 9 min lire
Une nouvelle méthode améliore le morphing de textures audio pour un design sonore créatif.
― 6 min lire
Une nouvelle méthode génère de l'audio à partir de texte en utilisant des modèles modernes.
― 7 min lire
Une compétition pour améliorer la création de sons Foley automatisés pour les multimédias.
― 7 min lire
Cette étude explore l'utilisation de playlists pour améliorer la classification et la similarité de la musique.
― 6 min lire
Une nouvelle méthode améliore la détection du son en utilisant des données étiquetées et non étiquetées.
― 8 min lire
Une nouvelle méthode combine la parole claire et les infos de bruit pour une meilleure clarté.
― 6 min lire
Comment l'apprentissage par transfert profond transforme les technologies de reconnaissance automatique de la parole.
― 8 min lire
Une technologie innovante sépare les voix musicales en utilisant des techniques de suivi avancées.
― 7 min lire
Les agriculteurs peuvent maintenant suivre les comportements des vaches avec précision, même avec le bruit de fond.
― 8 min lire
De nouvelles méthodes de transcription musicale montrent des promesses avec des données audio synthétisées.
― 8 min lire
Un gros ensemble de données sur les pleurs de bébés aide à comprendre la communication et la santé des nourrissons.
― 7 min lire
Une nouvelle méthode améliore les systèmes de détection de mots-clés dans des conditions de faibles ressources.
― 7 min lire
Un nouveau cadre améliore les prédictions de trajectoire de vol en utilisant des instructions vocales en temps réel.
― 5 min lire
Une nouvelle approche améliore le sous-titrage audio en générant des phrases plus claires et variées.
― 5 min lire
LORIS génère de la musique de haute qualité qui s'accorde parfaitement avec les mouvements de la vidéo.
― 7 min lire
Une étude montre que les CNN peuvent créer des combinaisons de mots à partir de données audio brutes.
― 9 min lire
PLiX utilise l'apprentissage par petits échantillons pour améliorer la reconnaissance vocale en plusieurs langues.
― 10 min lire
Cet article parle d'améliorer la détection des séquences sonores dans la reconnaissance audio.
― 7 min lire
Une étude révèle comment la clarté audio influence l'acquisition du langage chez les nourrissons.
― 7 min lire
Un outil améliore les systèmes de positionnement intérieur basés sur le son grâce à une simulation efficace.
― 6 min lire
Une nouvelle approche améliore la compréhension du langage parlé grâce à un traitement audio efficace.
― 8 min lire
Ce papier propose une méthode pour améliorer les CNN en supprimant les filtres inutiles.
― 6 min lire
Une nouvelle approche améliore la reconnaissance vocale en temps réel en équilibrant vitesse et précision.
― 9 min lire
X-LLM intègre des images, des vidéos et de la parole dans le traitement du langage.
― 7 min lire
Une nouvelle méthode améliore la détection des émotions dans la parole en utilisant des techniques d'auto-attention.
― 6 min lire