Améliorer la reconnaissance vocale pour des voix qui se chevauchent rend l'utilisation plus facile dans plein de situations.

2025-10-16T11:45:50+00:00 ― 6 min lire

Son Améliorer les techniques d'extraction de locuteurs

De nouvelles méthodes améliorent la séparation des voix dans des environnements audio mélangés.

2025-10-16T10:57:15+00:00 ― 6 min lire

Son Avancées dans la technologie d'extraction de la voix cible

Découvrez comment de nouvelles techniques améliorent la clarté de la parole dans des environnements bruyants.

2025-10-16T10:08:40+00:00 ― 6 min lire

Son UnitSpeech : Personnaliser la synthèse vocale avec peu de données

Une nouvelle méthode pour rendre la synthèse vocale plus personnelle en utilisant moins de données vocales.

2025-10-16T06:54:20+00:00 ― 6 min lire

Son Avancées dans le traitement audio avec des réseaux de neurones graphiques

De nouvelles méthodes améliorent la localisation du son grâce à des réseaux de micros distribués.

2025-10-16T06:05:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Équilibrer la vie privée et l'utilité dans l'analyse de la parole

Cette étude examine des méthodes pour protéger la vie privée tout en analysant des conversations parlées.

2025-10-16T05:17:10+00:00 ― 8 min lire

Son Nouvelles vulnérabilités dans les systèmes de reconnaissance vocale

Des attaques récentes par backdoor révèlent des risques dans les technologies d'identification vocale.

2025-10-16T02:51:25+00:00 ― 9 min lire

Son Avancée de la technologie d'isolation vocale

Un nouveau modèle améliore l'extraction de la parole des bruits de fond grâce à l'apprentissage profond.

2025-10-16T02:02:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Présentation de GOLF : une nouvelle ère dans la synthèse de voix chantées

GOLF propose une nouvelle façon de créer un chant qui sonne humain en utilisant moins de ressources.

2025-10-15T16:19:50+00:00 ― 8 min lire

Son Avancées dans la prédiction de l'âge et du genre par la voix

Recherche sur la prédiction de l'âge et du genre à partir de données vocales en utilisant des modèles innovants.

2025-10-15T13:54:05+00:00 ― 6 min lire

Son Analyser la musique avec des arbres de dépendance

Une nouvelle méthode pour comprendre les relations musicales à travers des arbres de dépendance.

2025-10-15T13:05:30+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des modèles à long contexte

Cet article parle de nouveaux modèles qui améliorent la précision de la reconnaissance vocale en tenant compte d'un contexte plus long.

2025-10-15T12:16:55+00:00 ― 7 min lire

Calcul et langage Présentation de LyricWhiz : Transformer la transcription des paroles

LyricWhiz combine des modèles avancés pour améliorer la précision de la transcription des paroles dans différentes langues.

2025-10-15T09:51:10+00:00 ― 7 min lire

Son Classification des chants d'oiseaux africains par analyse audio

Une étude sur l'utilisation d'enregistrements sonores pour identifier différentes espèces d'oiseaux en Afrique.

2025-10-15T09:02:35+00:00 ― 7 min lire

Recherche d'informations Comment les recommandations musicales utilisent l'analyse de données

Apprends comment les systèmes de recommandation suggèrent des chansons en fonction des goûts des utilisateurs.

2025-10-15T02:33:55+00:00 ― 6 min lire

Apprentissage automatique Traiter le déséquilibre des données dans la classification audio

Cet article parle des défis et des techniques pour gérer le déséquilibre des ensembles de données dans la classification audio.

2025-10-15T00:08:10+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les langues peu ressources

Une nouvelle approche améliore la reconnaissance vocale pour le roumain en utilisant l'inhibition latérale.

2025-10-14T23:19:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Faire avancer la confidentialité de genre dans l'audio : Nouvelles perspectives

La recherche met en avant des méthodes pour protéger la vie privée de genre dans l'audio parlé.

2025-10-14T21:42:25+00:00 ― 8 min lire

Son Comprendre les émotions dans la reconnaissance vocale

Un aperçu pour capturer les émotions derrière les mots dits plus précisément.

2025-10-14T16:02:20+00:00 ― 6 min lire

Son Faire avancer la classification musicale avec des embeddings audio

Utiliser des embeddings audio pré-entraînés permet d'avoir de meilleurs modèles de classification musicale.

2025-10-14T13:36:35+00:00 ― 9 min lire

Son Avancées dans la technologie de synthèse de la parole à partir des lèvres

Un nouveau cadre améliore la clarté des discours dans les vidéos silencieuses grâce à un traitement amélioré.

2025-10-13T19:47:45+00:00 ― 7 min lire

Son La science derrière le mridangam : un instrument unique

Découvrez le mélange d'art et de science dans l'étude du mridangam.

2025-10-13T17:19:15+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les langues à faibles ressources

Une nouvelle méthode améliore la reconnaissance de mots personnalisés dans les systèmes ASR pour les langues avec peu de données.

2025-10-13T13:19:05+00:00 ― 6 min lire

Son Avancées dans la détection de faux audio avec des modèles Conformer

Des chercheurs ont développé un modèle Conformer pour améliorer la détection des fausses audios.

2025-10-13T03:36:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancement de la détection de l'Alzheimer grâce à l'analyse de la parole

De nouvelles méthodes améliorent la détection précoce de l'Alzheimer en utilisant l'analyse de la parole et des sons.

2025-10-12T19:30:15+00:00 ― 9 min lire

Traitement de l'audio et de la parole Une nouvelle base de données révèle des infos sur les sons des instruments de musique

Explore des données sonores de 41 instruments de musique avec des enregistrements détaillés.

2025-10-12T15:27:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Progrès dans la reconnaissance vocale pour la dysarthrie

Les nouvelles technologies améliorent la communication pour les personnes avec des troubles de la parole.

2025-10-12T13:01:35+00:00 ― 7 min lire

Calcul et langage Progrès dans la technologie de traitement de la parole en temps réel

Un nouveau système combine transcription et traduction pour une meilleure communication.

2025-10-12T11:24:25+00:00 ― 6 min lire

Son Avancées dans la reconnaissance vocale avec Whisper-AT

Whisper-AT combine la reconnaissance vocale et le marquage audio pour de meilleures performances.

2025-10-12T08:10:05+00:00 ― 7 min lire

Traitement de l'audio et de la parole Intégrer la parole avec des modèles de langage : la méthode Speech-LLaMA

Une nouvelle approche qui combine la parole avec des modèles de langage pour une traduction améliorée.

2025-10-11T18:24:10+00:00 ― 6 min lire

Son Avancées dans la transcription automatique de piano

Une nouvelle méthode améliore la précision pour transformer l'audio de piano en partitions.

2025-10-11T14:21:15+00:00 ― 5 min lire

Son Avancées dans la synthèse de la parole articulatoire

Une étude sur l'amélioration de la reproduction sonore vocale grâce à des techniques de synthèse avancées.

2025-10-11T02:12:30+00:00 ― 7 min lire

Son Présentation de VampNet : Une nouvelle approche de la création musicale

VampNet transforme le traitement de la musique grâce à des techniques de modélisation de jetons innovantes.

2025-10-11T01:23:55+00:00 ― 5 min lire

Son EchoVest : Un nouvel espoir pour les malentendants

Technologie portable abordable pour les personnes malentendantes.

2025-10-10T23:46:45+00:00 ― 6 min lire

Son Amélioration de l'alignement des paroles dans les services de musique

Un nouveau modèle améliore la précision du timing pour les paroles dans les applis musicales.

2025-10-10T18:55:15+00:00 ― 7 min lire

Interaction homme-machine Présentation de SnakeSynth : Une nouvelle façon de créer du son

Un synthétiseur en ligne qui permet aux utilisateurs de créer de la musique avec des gestes simples.

2025-10-10T16:29:30+00:00 ― 5 min lire

Son IA et créativité dans la musique métal progressif

Une étude sur le rôle de l'IA dans la création de musique metal progressive.

2025-10-10T13:15:10+00:00 ― 8 min lire

Son ShredGP : Une nouvelle façon de créer de la musique guitare

Un modèle qui crée des tablatures de guitare reflétant le style de guitaristes célèbres.

2025-10-10T12:26:35+00:00 ― 7 min lire

Son Avancées dans l'apprentissage auto-supervisé pour l'analyse musicale

Explorer le potentiel de l'apprentissage auto-supervisé dans la recherche d'informations musicales.

2025-10-10T10:00:50+00:00 ― 8 min lire

Son Analyse audio dans la détection du COVID-19

Utiliser des signaux audio pour identifier les risques de santé respiratoire.

2025-10-10T09:12:15+00:00 ― 9 min lire

Informatique - Son