Génie électrique et science des systèmes - Traitement de l'audio et de la parole

Son Analyser la musique avec des arbres de dépendance

Une nouvelle méthode pour comprendre les relations musicales à travers des arbres de dépendance.

2025-10-15T13:05:30+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des modèles à long contexte

Cet article parle de nouveaux modèles qui améliorent la précision de la reconnaissance vocale en tenant compte d'un contexte plus long.

2025-10-15T12:16:55+00:00 ― 7 min lire

Calcul et langage Présentation de LyricWhiz : Transformer la transcription des paroles

LyricWhiz combine des modèles avancés pour améliorer la précision de la transcription des paroles dans différentes langues.

2025-10-15T09:51:10+00:00 ― 7 min lire

Son Classification des chants d'oiseaux africains par analyse audio

Une étude sur l'utilisation d'enregistrements sonores pour identifier différentes espèces d'oiseaux en Afrique.

2025-10-15T09:02:35+00:00 ― 7 min lire

Informatique neuronale et évolutive Faire avancer les réseaux de neurones à impulsions grâce à l'apprentissage des délais

Une nouvelle méthode améliore l'apprentissage dans les réseaux de neurones à spikes en intégrant des ajustements de délai.

2025-10-15T07:25:25+00:00 ― 8 min lire

Recherche d'informations Comment les recommandations musicales utilisent l'analyse de données

Apprends comment les systèmes de recommandation suggèrent des chansons en fonction des goûts des utilisateurs.

2025-10-15T02:33:55+00:00 ― 6 min lire

Apprentissage automatique Traiter le déséquilibre des données dans la classification audio

Cet article parle des défis et des techniques pour gérer le déséquilibre des ensembles de données dans la classification audio.

2025-10-15T00:08:10+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les langues peu ressources

Une nouvelle approche améliore la reconnaissance vocale pour le roumain en utilisant l'inhibition latérale.

2025-10-14T23:19:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Faire avancer la confidentialité de genre dans l'audio : Nouvelles perspectives

La recherche met en avant des méthodes pour protéger la vie privée de genre dans l'audio parlé.

2025-10-14T21:42:25+00:00 ― 8 min lire

Son Comprendre les émotions dans la reconnaissance vocale

Un aperçu pour capturer les émotions derrière les mots dits plus précisément.

2025-10-14T16:02:20+00:00 ― 6 min lire

Son Faire avancer la classification musicale avec des embeddings audio

Utiliser des embeddings audio pré-entraînés permet d'avoir de meilleurs modèles de classification musicale.

2025-10-14T13:36:35+00:00 ― 9 min lire

Traitement de l'audio et de la parole Nouveau modèle améliore la compréhension du traitement de la parole dans le cerveau

Des recherches montrent que les frontières des mots jouent un rôle dans la parole et l'activité EEG.

2025-10-14T11:59:25+00:00 ― 8 min lire

Son Avancées dans la technologie de synthèse de la parole à partir des lèvres

Un nouveau cadre améliore la clarté des discours dans les vidéos silencieuses grâce à un traitement amélioré.

2025-10-13T19:47:45+00:00 ― 7 min lire

Son La science derrière le mridangam : un instrument unique

Découvrez le mélange d'art et de science dans l'étude du mridangam.

2025-10-13T17:19:15+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les langues à faibles ressources

Une nouvelle méthode améliore la reconnaissance de mots personnalisés dans les systèmes ASR pour les langues avec peu de données.

2025-10-13T13:19:05+00:00 ― 6 min lire

Son Avancées dans la détection de faux audio avec des modèles Conformer

Des chercheurs ont développé un modèle Conformer pour améliorer la détection des fausses audios.

2025-10-13T03:36:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Protéger la vie privée de genre dans les systèmes de reconnaissance vocale

Une méthode pour cacher les infos de genre tout en garantissant la vérification d'identité dans la reconnaissance vocale.

2025-10-12T22:44:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancement de la détection de l'Alzheimer grâce à l'analyse de la parole

De nouvelles méthodes améliorent la détection précoce de l'Alzheimer en utilisant l'analyse de la parole et des sons.

2025-10-12T19:30:15+00:00 ― 9 min lire

Traitement de l'audio et de la parole Une nouvelle base de données révèle des infos sur les sons des instruments de musique

Explore des données sonores de 41 instruments de musique avec des enregistrements détaillés.

2025-10-12T15:27:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancer les embeddings acoustiques de mots pour le langage parlé

Recherche sur l'amélioration des embeddings acoustiques des mots avec compréhension sémantique et données multilingues.

2025-10-12T14:38:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Progrès dans la reconnaissance vocale pour la dysarthrie

Les nouvelles technologies améliorent la communication pour les personnes avec des troubles de la parole.

2025-10-12T13:01:35+00:00 ― 7 min lire

Calcul et langage Progrès dans la technologie de traitement de la parole en temps réel

Un nouveau système combine transcription et traduction pour une meilleure communication.

2025-10-12T11:24:25+00:00 ― 6 min lire

Son Avancées dans la reconnaissance vocale avec Whisper-AT

Whisper-AT combine la reconnaissance vocale et le marquage audio pour de meilleures performances.

2025-10-12T08:10:05+00:00 ― 7 min lire

Traitement de l'audio et de la parole Intégrer la parole avec des modèles de langage : la méthode Speech-LLaMA

Une nouvelle approche qui combine la parole avec des modèles de langage pour une traduction améliorée.

2025-10-11T18:24:10+00:00 ― 6 min lire

Son Avancées dans la transcription automatique de piano

Une nouvelle méthode améliore la précision pour transformer l'audio de piano en partitions.

2025-10-11T14:21:15+00:00 ― 5 min lire

Traitement de l'audio et de la parole Le paysage évolutif de l'IA audio générative

Cet article parle des besoins et des défis dans la technologie audio générative.

2025-10-11T13:32:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la détection de la tuberculose grâce à l'analyse de la toux

De nouvelles méthodes utilisent les sons de la toux et des données de santé pour mieux détecter la tuberculose.

2025-10-11T09:29:45+00:00 ― 7 min lire

Traitement de l'audio et de la parole Changements de voix chez les patients atteints de cancer de la bouche pendant le traitement

Cette étude examine comment les caractéristiques vocales évoluent chez les patients atteints de cancer de la bouche après le traitement.

2025-10-11T08:41:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancer le transfert de timbre avec DiffTransfer

Une nouvelle méthode pour changer le timbre musical en utilisant des techniques avancées d'apprentissage machine.

2025-10-11T07:52:35+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des RNN-Transducteurs

De nouvelles méthodes améliorent la précision de la reconnaissance vocale, en s'attaquant aux erreurs courantes de transcription.

2025-10-11T04:38:15+00:00 ― 6 min lire

Son Avancées dans la synthèse de la parole articulatoire

Une étude sur l'amélioration de la reproduction sonore vocale grâce à des techniques de synthèse avancées.

2025-10-11T02:12:30+00:00 ― 7 min lire

Son Présentation de VampNet : Une nouvelle approche de la création musicale

VampNet transforme le traitement de la musique grâce à des techniques de modélisation de jetons innovantes.

2025-10-11T01:23:55+00:00 ― 5 min lire

Son EchoVest : Un nouvel espoir pour les malentendants

Technologie portable abordable pour les personnes malentendantes.

2025-10-10T23:46:45+00:00 ― 6 min lire

Son Amélioration de l'alignement des paroles dans les services de musique

Un nouveau modèle améliore la précision du timing pour les paroles dans les applis musicales.

2025-10-10T18:55:15+00:00 ― 7 min lire

Interaction homme-machine Présentation de SnakeSynth : Une nouvelle façon de créer du son

Un synthétiseur en ligne qui permet aux utilisateurs de créer de la musique avec des gestes simples.

2025-10-10T16:29:30+00:00 ― 5 min lire

Son IA et créativité dans la musique métal progressif

Une étude sur le rôle de l'IA dans la création de musique metal progressive.

2025-10-10T13:15:10+00:00 ― 8 min lire

Son ShredGP : Une nouvelle façon de créer de la musique guitare

Un modèle qui crée des tablatures de guitare reflétant le style de guitaristes célèbres.

2025-10-10T12:26:35+00:00 ― 7 min lire

Son Avancées dans l'apprentissage auto-supervisé pour l'analyse musicale

Explorer le potentiel de l'apprentissage auto-supervisé dans la recherche d'informations musicales.

2025-10-10T10:00:50+00:00 ― 8 min lire

Son Analyse audio dans la détection du COVID-19

Utiliser des signaux audio pour identifier les risques de santé respiratoire.

2025-10-10T09:12:15+00:00 ― 9 min lire

Calcul et langage RésuméMixage : Une nouvelle approche de la reconnaissance vocale

Une nouvelle méthode améliore la vitesse et la précision de la reconnaissance vocale tout en réduisant l'utilisation des ressources.

2025-10-10T07:35:05+00:00 ― 7 min lire