De nouvelles méthodes améliorent la détection précoce des problèmes de voix en utilisant des caractéristiques de la source glottale.

2025-09-04T10:02:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour des accents variés

Améliorer les modèles de parole pour mieux reconnaître et s'adapter à différents accents.

2025-09-04T08:25:15+00:00 ― 6 min lire

Son Avancées dans la classification audio avec DCLS

DCLS améliore la performance de classification audio en apprenant les positions des noyaux pendant l'entraînement.

2025-09-04T07:36:40+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer l'apprentissage audio-visuel avec la co-augmentation rapide

Une nouvelle méthode améliore l'apprentissage machine des données audio-visuelles.

2025-09-04T05:59:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'extraction de la parole

Présentation de nouveaux modèles pour mieux extraire la parole dans des environnements bruyants.

2025-09-04T02:45:10+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec l'adaptation de faible rang

Une nouvelle méthode améliore l'efficacité de la reconnaissance vocale en utilisant une adaptation de faible rang.

2025-09-04T00:19:25+00:00 ― 6 min lire

Traitement du signal Une nouvelle approche pour identifier les symptômes de la schizophrénie

Combiner audio, vidéo et texte pour de meilleures évaluations de santé mentale.

2025-09-03T22:42:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec de nouvelles techniques

Un aperçu des avancées en reconnaissance vocale pour améliorer la rapidité et la précision.

2025-09-03T21:05:05+00:00 ― 7 min lire

Calcul et langage Combler les lacunes linguistiques dans le secteur de la santé

Améliorer la communication entre doc et patient grâce à des technologies de reconnaissance vocale avancées.

2025-09-03T18:39:20+00:00 ― 7 min lire

Son La Mélodie de Synthia : Un nouvel outil pour la recherche audio

La mélodie de Synthia aide les chercheurs à tester des modèles audio avec des données variées.

2025-09-03T14:36:25+00:00 ― 7 min lire

Calcul et langage Aborder les défis de la reconnaissance automatique de la parole en long format

La recherche se concentre sur l'amélioration des systèmes ASR pour l'audio non segmenté.

2025-09-03T13:47:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancement de la synthèse vocale pour un audio réaliste

La recherche se concentre sur l'optimisation des synthétiseurs pour les vocalisations humaines dans différents médias.

2025-09-03T09:44:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Amélioration de la Vérification Vocale : Gérer la Variabilité de Session

Une nouvelle méthode améliore la vérification des locuteurs en gérant efficacement la variabilité des sessions.

2025-09-03T08:56:20+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des grands modèles de langage

Les LLMs améliorent la précision et la correction des erreurs dans les systèmes de reconnaissance vocale.

2025-09-03T06:30:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole MC-SimCLR : Faire avancer l'apprentissage sonore et la sensibilisation à la localisation

Une nouvelle méthode améliore la reconnaissance sonore et la localisation des sources sans étiquettes.

2025-09-03T00:50:30+00:00 ― 7 min lire

Calcul et langage HyPoradise : Améliorer la précision de la reconnaissance vocale automatique

Un nouveau standard pour améliorer la précision de la reconnaissance vocale avec des modèles de langue.

2025-09-02T23:13:20+00:00 ― 8 min lire

Calcul et langage Avancées dans la traduction vocale grâce au contexte

De nouvelles méthodes améliorent la traduction de la parole en se concentrant sur les informations contextuelles.

2025-09-02T22:24:45+00:00 ― 7 min lire

Son Faire avancer la technologie vocale avec des données de changement de code

Une nouvelle méthode améliore la reconnaissance vocale pour les utilisateurs qui passent d'une langue à l'autre.

2025-09-02T21:36:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Exploiter la détection de sons anormaux pour de meilleurs résultats

Découvre comment l'analyse sonore aide à repérer les problèmes de machines rapidement.

2025-09-02T20:47:35+00:00 ― 7 min lire

Calcul et langage Progrès dans la traduction vocale et les sous-titres

Ce projet améliore la traduction vocale en temps réel et les systèmes de sous-titrage automatiques.

2025-09-02T18:21:50+00:00 ― 5 min lire

Son Nouvelles idées sur la généralisation dans les réseaux de neurones

Explorer comment la netteté des minima influence la performance du modèle sur des données audio inaperçues.

2025-09-02T15:56:05+00:00 ― 6 min lire

Son Combiner voix et visage pour une meilleure identification

Une nouvelle méthode améliore la vérification des locuteurs en combinant les données audio et visuelles.

2025-09-02T07:50:15+00:00 ― 6 min lire

Son Transformers dans l'apprentissage de la représentation musicale

Une étude sur l'utilisation des transformateurs pour un étiquetage et une représentation musicale efficaces.

2025-09-02T07:01:40+00:00 ― 8 min lire

Multimédia Avancées dans la localisation des haut-parleurs audio-visuels

Une nouvelle méthode améliore le suivi des intervenants en utilisant des données audio et visuelles.

2025-09-02T06:13:05+00:00 ― 8 min lire

Son Nouvelle méthode pour analyser la difficulté de la musique au piano

Une nouvelle façon d'évaluer la difficulté des morceaux de piano en utilisant des images de partitions.

2025-09-02T05:24:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les transcriptions de réunion avec le système PP-MeT

PP-MeT vise à améliorer la précision dans la retranscription de réunions avec plusieurs intervenants.

2025-09-02T04:35:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une approche universelle pour l'amélioration de la voix

Cette recherche présente un modèle pour améliorer la clarté de la parole dans différentes conditions.

2025-09-02T02:10:10+00:00 ― 7 min lire

Son L'essor du sous-titrage audio automatisé

Explorer les avancées dans le sous-titrage audio automatisé et son impact sur l'accessibilité.

2025-09-02T01:21:35+00:00 ― 6 min lire

Son Séparation de la parole innovante en utilisant des données audio et visuelles

Une recherche dévoile une méthode efficace pour améliorer la clarté de la parole dans des environnements bruyants.

2025-09-02T00:33:00+00:00 ― 9 min lire

Apprentissage automatique Avancer le matching de style audio avec des effets traditionnels

Une nouvelle méthode simplifie le transfert de style audio en utilisant des effets non-différentiables.

2025-09-01T19:41:30+00:00 ― 9 min lire

Son Évaluer la qualité des performances de piano générées par ordinateur

La recherche examine comment la musique informatique se compare à la performance humaine à travers des tests d'écoute.

2025-09-01T07:32:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Améliorer le design sonore avec des polynômes ultrasphériques

Découvre comment les polynômes ultrasphériques améliorent la technologie audio et la directionnalité du son.

2025-09-01T05:55:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Faire avancer la reconnaissance vocale avec le SSRL

Une nouvelle méthode améliore la reconnaissance vocale en utilisant moins d'étiquettes et de ressources.

2025-09-01T00:15:30+00:00 ― 8 min lire

Son Avancées dans les techniques de mise en relation texte-audio

De nouvelles méthodes améliorent le lien entre les descriptions textuelles et les événements sonores.

2025-08-31T16:09:40+00:00 ― 9 min lire

Traitement de l'audio et de la parole Détection de la direction du son dans des robots en mouvement

Des méthodes innovantes améliorent la façon dont les robots traitent la direction du son en mouvement.

2025-08-31T14:32:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de formation de faisceaux

Apprends-en sur le beamforming à valeurs réelles et ses avantages pour les réseaux de microphones.

2025-08-31T12:06:45+00:00 ― 7 min lire

Son Un nouveau modèle pour la génération de musique avec l'IA

MusicAOG simplifie la création et la compréhension de la musique grâce à une représentation graphique innovante.

2025-08-31T08:52:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Conception de systèmes MIMO efficaces avec des réseaux sphériques

Un nouveau cadre pour combiner des réseaux de microphones sphériques et de haut-parleurs dans les études sonores.

2025-08-31T07:15:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Concevoir des systèmes auditifs efficaces pour les robots humanoïdes

Un nouveau cadre pour améliorer la détection des sons dans les robots humanoïdes grâce à la conception de réseaux de microphones.

2025-08-31T06:26:40+00:00 ― 10 min lire

Traitement de l'audio et de la parole Améliorer l'acoustique des pièces avec des systèmes MIMO

Découvre comment les systèmes MIMO améliorent l'analyse sonore dans différents environnements.

2025-08-31T02:23:45+00:00 ― 9 min lire

Informatique - Son