Améliorer la communication entre doc et patient grâce à des technologies de reconnaissance vocale avancées.

2025-09-03T18:39:20+00:00 ― 7 min lire

Son La Mélodie de Synthia : Un nouvel outil pour la recherche audio

La mélodie de Synthia aide les chercheurs à tester des modèles audio avec des données variées.

2025-09-03T14:36:25+00:00 ― 7 min lire

Calcul et langage Aborder les défis de la reconnaissance automatique de la parole en long format

La recherche se concentre sur l'amélioration des systèmes ASR pour l'audio non segmenté.

2025-09-03T13:47:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancement de la synthèse vocale pour un audio réaliste

La recherche se concentre sur l'optimisation des synthétiseurs pour les vocalisations humaines dans différents médias.

2025-09-03T09:44:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Amélioration de la Vérification Vocale : Gérer la Variabilité de Session

Une nouvelle méthode améliore la vérification des locuteurs en gérant efficacement la variabilité des sessions.

2025-09-03T08:56:20+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des grands modèles de langage

Les LLMs améliorent la précision et la correction des erreurs dans les systèmes de reconnaissance vocale.

2025-09-03T06:30:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole MC-SimCLR : Faire avancer l'apprentissage sonore et la sensibilisation à la localisation

Une nouvelle méthode améliore la reconnaissance sonore et la localisation des sources sans étiquettes.

2025-09-03T00:50:30+00:00 ― 7 min lire

Calcul et langage HyPoradise : Améliorer la précision de la reconnaissance vocale automatique

Un nouveau standard pour améliorer la précision de la reconnaissance vocale avec des modèles de langue.

2025-09-02T23:13:20+00:00 ― 8 min lire

Calcul et langage Avancées dans la traduction vocale grâce au contexte

De nouvelles méthodes améliorent la traduction de la parole en se concentrant sur les informations contextuelles.

2025-09-02T22:24:45+00:00 ― 7 min lire

Son Faire avancer la technologie vocale avec des données de changement de code

Une nouvelle méthode améliore la reconnaissance vocale pour les utilisateurs qui passent d'une langue à l'autre.

2025-09-02T21:36:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Exploiter la détection de sons anormaux pour de meilleurs résultats

Découvre comment l'analyse sonore aide à repérer les problèmes de machines rapidement.

2025-09-02T20:47:35+00:00 ― 7 min lire

Calcul et langage Progrès dans la traduction vocale et les sous-titres

Ce projet améliore la traduction vocale en temps réel et les systèmes de sous-titrage automatiques.

2025-09-02T18:21:50+00:00 ― 5 min lire

Son Nouvelles idées sur la généralisation dans les réseaux de neurones

Explorer comment la netteté des minima influence la performance du modèle sur des données audio inaperçues.

2025-09-02T15:56:05+00:00 ― 6 min lire

Son Combiner voix et visage pour une meilleure identification

Une nouvelle méthode améliore la vérification des locuteurs en combinant les données audio et visuelles.

2025-09-02T07:50:15+00:00 ― 6 min lire

Son Transformers dans l'apprentissage de la représentation musicale

Une étude sur l'utilisation des transformateurs pour un étiquetage et une représentation musicale efficaces.

2025-09-02T07:01:40+00:00 ― 8 min lire

Multimédia Avancées dans la localisation des haut-parleurs audio-visuels

Une nouvelle méthode améliore le suivi des intervenants en utilisant des données audio et visuelles.

2025-09-02T06:13:05+00:00 ― 8 min lire

Son Nouvelle méthode pour analyser la difficulté de la musique au piano

Une nouvelle façon d'évaluer la difficulté des morceaux de piano en utilisant des images de partitions.

2025-09-02T05:24:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les transcriptions de réunion avec le système PP-MeT

PP-MeT vise à améliorer la précision dans la retranscription de réunions avec plusieurs intervenants.

2025-09-02T04:35:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une approche universelle pour l'amélioration de la voix

Cette recherche présente un modèle pour améliorer la clarté de la parole dans différentes conditions.

2025-09-02T02:10:10+00:00 ― 7 min lire

Son L'essor du sous-titrage audio automatisé

Explorer les avancées dans le sous-titrage audio automatisé et son impact sur l'accessibilité.

2025-09-02T01:21:35+00:00 ― 6 min lire

Son Séparation de la parole innovante en utilisant des données audio et visuelles

Une recherche dévoile une méthode efficace pour améliorer la clarté de la parole dans des environnements bruyants.

2025-09-02T00:33:00+00:00 ― 9 min lire

Apprentissage automatique Avancer le matching de style audio avec des effets traditionnels

Une nouvelle méthode simplifie le transfert de style audio en utilisant des effets non-différentiables.

2025-09-01T19:41:30+00:00 ― 9 min lire

Son Évaluer la qualité des performances de piano générées par ordinateur

La recherche examine comment la musique informatique se compare à la performance humaine à travers des tests d'écoute.

2025-09-01T07:32:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Améliorer le design sonore avec des polynômes ultrasphériques

Découvre comment les polynômes ultrasphériques améliorent la technologie audio et la directionnalité du son.

2025-09-01T05:55:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Faire avancer la reconnaissance vocale avec le SSRL

Une nouvelle méthode améliore la reconnaissance vocale en utilisant moins d'étiquettes et de ressources.

2025-09-01T00:15:30+00:00 ― 8 min lire

Son Avancées dans les techniques de mise en relation texte-audio

De nouvelles méthodes améliorent le lien entre les descriptions textuelles et les événements sonores.

2025-08-31T16:09:40+00:00 ― 9 min lire

Traitement de l'audio et de la parole Détection de la direction du son dans des robots en mouvement

Des méthodes innovantes améliorent la façon dont les robots traitent la direction du son en mouvement.

2025-08-31T14:32:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de formation de faisceaux

Apprends-en sur le beamforming à valeurs réelles et ses avantages pour les réseaux de microphones.

2025-08-31T12:06:45+00:00 ― 7 min lire

Son Un nouveau modèle pour la génération de musique avec l'IA

MusicAOG simplifie la création et la compréhension de la musique grâce à une représentation graphique innovante.

2025-08-31T08:52:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Conception de systèmes MIMO efficaces avec des réseaux sphériques

Un nouveau cadre pour combiner des réseaux de microphones sphériques et de haut-parleurs dans les études sonores.

2025-08-31T07:15:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Concevoir des systèmes auditifs efficaces pour les robots humanoïdes

Un nouveau cadre pour améliorer la détection des sons dans les robots humanoïdes grâce à la conception de réseaux de microphones.

2025-08-31T06:26:40+00:00 ― 10 min lire

Traitement de l'audio et de la parole Améliorer l'acoustique des pièces avec des systèmes MIMO

Découvre comment les systèmes MIMO améliorent l'analyse sonore dans différents environnements.

2025-08-31T02:23:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans la recherche sur l'acoustique des salles

De nouvelles techniques améliorent l'estimation de la direction du son pour différents réglages audio.

2025-08-31T01:35:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Contrôler le son pour des expériences d'écoute plus claires

Des recherches montrent des astuces pour ajuster le son dans les pièces afin d'améliorer la clarté.

2025-08-31T00:46:35+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Détecter l'humour dans les vidéos avec FunnyNet-W

Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.

2025-08-30T23:09:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Progrès dans les élastomères diélectriques pour la technologie

Les élastomères diélectriques convertissent l'énergie électrique en mouvement mécanique, offrant des applications diverses.

2025-08-30T20:43:40+00:00 ― 9 min lire

Calcul et langage Utiliser la technologie ASR pour aider au diagnostic de la démence

Les transcriptions ASR avec des erreurs peuvent aider à identifier la maladie d'Alzheimer plus précisément.

2025-08-30T16:40:45+00:00 ― 10 min lire

Calcul et langage Présentation d'ELLA-V : Un nouveau chapitre dans la synthèse vocale

ELLA-V améliore la qualité et le contrôle de la synthèse vocale, surpassant les modèles précédents.

2025-08-30T01:17:40+00:00 ― 7 min lire

Méthodes quantitatives Une nouvelle méthode améliore la surveillance acoustique de la faune

Une nouvelle approche améliore la précision de détection des cris d'animaux sans seuils arbitraires.

2025-08-29T23:46:39+00:00 ― 8 min lire

Calcul et langage Faire avancer la classification de la parole avec des données multimodales

Un nouveau modèle intègre l'audio et le texte pour une meilleure classification de la parole.

2025-08-29T18:49:00+00:00 ― 8 min lire

Informatique - Son