Une nouvelle méthode améliore la séparation des voix en utilisant plusieurs micros sans données étiquetées.

2025-10-30T15:50:50+00:00 ― 5 min lire

Son Amélioration des techniques anti-spoofing audio

Une étude améliore les modèles de vérification des speakers pour mieux protéger l'identité.

2025-10-30T15:02:15+00:00 ― 8 min lire

Calcul et langage Avancées dans les systèmes de réponse audio aux questions

De nouveaux modèles améliorent la façon dont les machines réagissent aux questions basées sur l’audio.

2025-10-30T13:25:05+00:00 ― 6 min lire

Calcul et langage Avancées dans la synthèse vocale en suisse-allemand

De nouvelles méthodes améliorent la synthèse vocale pour l'allemand suisse à partir de textes en allemand standard.

2025-10-30T10:59:20+00:00 ― 6 min lire

Son Avancer la Détection d'Activité Voix avec SVVAD

Découvrez comment SVVAD améliore la détection de l'activité vocale pour une meilleure vérification des locuteurs.

2025-10-30T09:22:10+00:00 ― 6 min lire

Son Avancées dans l'évaluation automatique de la prononciation

Une nouvelle méthode améliore les retours sur la prononciation pour les apprenants de langues.

2025-10-30T08:33:35+00:00 ― 7 min lire

Calcul et langage Mesurer l'adaptabilité des modèles de reconnaissance vocale

Un nouveau cadre évalue comment les modèles de parole s'adaptent à des tâches spécifiques.

2025-10-30T06:56:25+00:00 ― 8 min lire

Son Faire avancer le traitement de la parole avec HuBERT

Les modèles HuBERT améliorent les tâches de parole en utilisant plusieurs résolutions pour de meilleures performances.

2025-10-29T22:02:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'identification des locuteurs

De nouvelles techniques améliorent la précision pour reconnaître les intervenants et détecter les imposteurs.

2025-10-29T20:24:50+00:00 ― 6 min lire

Son Amélioration des effets audio analogiques virtuels avec l'apprentissage profond

Une nouvelle approche améliore la réponse de phase dans les effets audio virtuels en utilisant l'apprentissage profond.

2025-10-29T18:47:40+00:00 ― 6 min lire

Son Ralentissement dans la Reconnaissance Vocale : Un Regard de Plus Près sur SlothSpeech

SlothSpeech dévoile des failles dans les systèmes de reconnaissance vocale, les ralentissant considérablement.

2025-10-29T17:10:30+00:00 ― 6 min lire

Son UnDiff : Une nouvelle approche pour la clarté audio

UnDiff améliore la qualité audio grâce à des techniques innovantes de restauration de la parole.

2025-10-29T16:21:55+00:00 ― 7 min lire

Son Avancées dans la technologie de détection du bégaiement

De nouvelles méthodes en apprentissage automatique améliorent les capacités de détection du bégaiement.

2025-10-29T14:44:45+00:00 ― 6 min lire

Son EmoMix : Faire avancer la synthèse vocale émotionnelle

EmoMix permet de créer des discours exprimant des émotions mélangées avec une intensité précise.

2025-10-29T13:56:10+00:00 ― 6 min lire

Son MW-MAE : Une nouvelle approche de l'apprentissage audio

Découvrez la méthode innovante du Multi-Window Masked Autoencoder pour améliorer le traitement audio.

2025-10-29T11:30:25+00:00 ― 6 min lire

Son Améliorer la restauration audio avec des indices visuels

Une nouvelle méthode fusionne des données audio et visuelles pour réparer la parole manquante.

2025-10-29T10:41:50+00:00 ― 7 min lire

Calcul et langage Lutter contre les discours de haine dans les langues à faibles ressources

Explorer des méthodes pour détecter les discours de haine dans les diffusions audio de langues sous-représentées.

2025-10-29T09:04:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Raviver le Son : La Méthode BABE pour la Restauration Audio

Une nouvelle méthode restaure les hautes fréquences perdues dans les enregistrements historiques.

2025-10-29T06:38:55+00:00 ― 8 min lire

Son Faire avancer la simulation sonore avec BEDRF

Un nouveau modèle améliore la diffraction du son dans les environnements virtuels.

2025-10-29T01:47:25+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale avec un biais contextuel

Le biais contextuel améliore les systèmes de reconnaissance vocale, augmentant la précision dans les tâches spécialisées.

2025-10-29T00:58:50+00:00 ― 7 min lire

Son Nouvelle méthode pour améliorer la détection de la prononciation des langues

Cette étude présente un nouveau système pour détecter les erreurs de prononciation chez les apprenants de langues.

2025-10-28T21:44:30+00:00 ― 7 min lire

Son Une nouvelle approche pour réarranger la musique

Le système Q A utilise l'apprentissage auto-supervisé pour réorganiser la musique de manière innovante.

2025-10-28T20:07:20+00:00 ― 7 min lire

Son Amélioration de la synthèse vocale expressive avec TVC-GMM

Une nouvelle méthode améliore la qualité du texte en parole et l'expression émotionnelle.

2025-10-28T18:30:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Faire avancer la reconnaissance vocale avec des modèles plus petits

Des techniques pour réduire la taille des modèles tout en gardant la performance émergent.

2025-10-28T15:15:50+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans les effets de phasage numérique

Nouveau modèle imite les effets de phasage analogique avec des techniques d'apprentissage améliorées.

2025-10-28T12:50:05+00:00 ― 6 min lire

Calcul et langage Faire avancer la reconnaissance vocale multilingue avec DistilXLSR

Un nouveau modèle réduit la taille tout en améliorant la reconnaissance vocale multilingue.

2025-10-28T11:12:55+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale pour des accents variés

Une nouvelle méthode améliore la précision de la reconnaissance vocale pour les accents africains.

2025-10-28T09:35:45+00:00 ― 6 min lire

Calcul et langage Avancées dans la reconnaissance vocale pour plusieurs intervenants

Un nouveau système améliore la reconnaissance vocale dans des situations avec plusieurs intervenants.

2025-10-28T00:41:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de la conversion des lèvres en parole

LipVoicer génère une voix claire à partir de vidéos silencieuses en utilisant des méthodes de lecture labiale avancées.

2025-10-27T21:27:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance de la parole dysarthrique avec des approches innovantes

De nouvelles méthodes visent à améliorer la communication des personnes atteintes de dysarthrie.

2025-10-27T21:01:09+00:00 ― 8 min lire

Calcul et langage Amélioration des prévisions avec plusieurs scores dans les processus gaussiens

Une nouvelle méthode améliore les prévisions en tenant compte des scores de plusieurs experts.

2025-10-27T19:49:50+00:00 ― 7 min lire

Calcul et langage Évaluer la performance de Whisper sur les dialectes arabes

Un aperçu de comment Whisper gère les différents dialectes et accents arabes.

2025-10-27T13:21:10+00:00 ― 6 min lire

Calcul et langage Video-LLaMA : Une nouvelle approche pour comprendre les vidéos

Un programme qui combine des données visuelles et audio pour améliorer la compréhension des vidéos.

2025-10-27T11:44:00+00:00 ― 6 min lire

Calcul et langage Avancer la reconnaissance des actes de parole en bengali

Une nouvelle méthode améliore la reconnaissance des actes de parole en bengali grâce à l'analyse audio et textuelle.

2025-10-27T10:55:25+00:00 ― 6 min lire

Son Analyser la musique avec BERT : une nouvelle approche

La recherche explore le potentiel de BERT dans l'analyse musicale au niveau des bars.

2025-10-27T07:41:05+00:00 ― 6 min lire

Ordinateurs et société Apprendre les maths en s'amusant pour les petits

Un nouveau système améliore l'apprentissage des maths à la maison grâce à des interactions amusantes.

2025-10-27T07:08:49+00:00 ― 7 min lire

Calcul et langage Adaptation efficace de la reconnaissance vocale grâce aux données textuelles

Une nouvelle méthode améliore les modèles de reconnaissance vocale en utilisant seulement des données textuelles pour l'adaptation.

2025-10-27T06:52:30+00:00 ― 7 min lire

Son Avancée de l'harmonisation des mélodies avec un contexte émotionnel

Un nouveau modèle améliore l'harmonisation des mélodies en tenant compte des facteurs émotionnels.

2025-10-26T21:58:05+00:00 ― 8 min lire

Apprentissage automatique Création de danse innovante avec des mots sonores

De nouvelles méthodes utilisent l'onomatopée pour inspirer des mouvements de danse uniques.

2025-10-26T20:20:55+00:00 ― 6 min lire

Son Avancées dans les systèmes de contre-mesures vocales

Des chercheurs améliorent la détection de la parole générée par machine en ajustant les informations de phase.

2025-10-26T17:55:10+00:00 ― 7 min lire

Informatique - Son