Génie électrique et science des systèmes - Traitement de l'audio et de la parole

RSS

Calcul et langage Avancées dans la traduction vocale grâce au contexte

De nouvelles méthodes améliorent la traduction de la parole en se concentrant sur les informations contextuelles.

2025-09-02T22:24:45+00:00 ― 7 min lire

Son Faire avancer la technologie vocale avec des données de changement de code

Une nouvelle méthode améliore la reconnaissance vocale pour les utilisateurs qui passent d'une langue à l'autre.

2025-09-02T21:36:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Exploiter la détection de sons anormaux pour de meilleurs résultats

Découvre comment l'analyse sonore aide à repérer les problèmes de machines rapidement.

2025-09-02T20:47:35+00:00 ― 7 min lire

Calcul et langage Progrès dans la traduction vocale et les sous-titres

Ce projet améliore la traduction vocale en temps réel et les systèmes de sous-titrage automatiques.

2025-09-02T18:21:50+00:00 ― 5 min lire

Son Nouvelles idées sur la généralisation dans les réseaux de neurones

Explorer comment la netteté des minima influence la performance du modèle sur des données audio inaperçues.

2025-09-02T15:56:05+00:00 ― 6 min lire

Son Combiner voix et visage pour une meilleure identification

Une nouvelle méthode améliore la vérification des locuteurs en combinant les données audio et visuelles.

2025-09-02T07:50:15+00:00 ― 6 min lire

Son Transformers dans l'apprentissage de la représentation musicale

Une étude sur l'utilisation des transformateurs pour un étiquetage et une représentation musicale efficaces.

2025-09-02T07:01:40+00:00 ― 8 min lire

Multimédia Avancées dans la localisation des haut-parleurs audio-visuels

Une nouvelle méthode améliore le suivi des intervenants en utilisant des données audio et visuelles.

2025-09-02T06:13:05+00:00 ― 8 min lire

Son Nouvelle méthode pour analyser la difficulté de la musique au piano

Une nouvelle façon d'évaluer la difficulté des morceaux de piano en utilisant des images de partitions.

2025-09-02T05:24:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les transcriptions de réunion avec le système PP-MeT

PP-MeT vise à améliorer la précision dans la retranscription de réunions avec plusieurs intervenants.

2025-09-02T04:35:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une approche universelle pour l'amélioration de la voix

Cette recherche présente un modèle pour améliorer la clarté de la parole dans différentes conditions.

2025-09-02T02:10:10+00:00 ― 7 min lire

Son L'essor du sous-titrage audio automatisé

Explorer les avancées dans le sous-titrage audio automatisé et son impact sur l'accessibilité.

2025-09-02T01:21:35+00:00 ― 6 min lire

Son Séparation de la parole innovante en utilisant des données audio et visuelles

Une recherche dévoile une méthode efficace pour améliorer la clarté de la parole dans des environnements bruyants.

2025-09-02T00:33:00+00:00 ― 9 min lire

Apprentissage automatique Avancer le matching de style audio avec des effets traditionnels

Une nouvelle méthode simplifie le transfert de style audio en utilisant des effets non-différentiables.

2025-09-01T19:41:30+00:00 ― 9 min lire

Son Évaluer la qualité des performances de piano générées par ordinateur

La recherche examine comment la musique informatique se compare à la performance humaine à travers des tests d'écoute.

2025-09-01T07:32:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Améliorer le design sonore avec des polynômes ultrasphériques

Découvre comment les polynômes ultrasphériques améliorent la technologie audio et la directionnalité du son.

2025-09-01T05:55:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancer la reconstruction du champ sonore avec l'IA

Utiliser l'IA pour améliorer comment on recrée le son dans différents environnements.

2025-09-01T01:52:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Faire avancer la reconnaissance vocale avec le SSRL

Une nouvelle méthode améliore la reconnaissance vocale en utilisant moins d'étiquettes et de ressources.

2025-09-01T00:15:30+00:00 ― 8 min lire

Son Avancées dans les techniques de mise en relation texte-audio

De nouvelles méthodes améliorent le lien entre les descriptions textuelles et les événements sonores.

2025-08-31T16:09:40+00:00 ― 9 min lire

Traitement de l'audio et de la parole Détection de la direction du son dans des robots en mouvement

Des méthodes innovantes améliorent la façon dont les robots traitent la direction du son en mouvement.

2025-08-31T14:32:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de formation de faisceaux

Apprends-en sur le beamforming à valeurs réelles et ses avantages pour les réseaux de microphones.

2025-08-31T12:06:45+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans les modèles de synthèse vocale conversationnelle

Une nouvelle approche pour la génération de discours petite, efficace et qui sonne naturel.

2025-08-31T09:41:00+00:00 ― 12 min lire

Son Un nouveau modèle pour la génération de musique avec l'IA

MusicAOG simplifie la création et la compréhension de la musique grâce à une représentation graphique innovante.

2025-08-31T08:52:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Conception de systèmes MIMO efficaces avec des réseaux sphériques

Un nouveau cadre pour combiner des réseaux de microphones sphériques et de haut-parleurs dans les études sonores.

2025-08-31T07:15:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Concevoir des systèmes auditifs efficaces pour les robots humanoïdes

Un nouveau cadre pour améliorer la détection des sons dans les robots humanoïdes grâce à la conception de réseaux de microphones.

2025-08-31T06:26:40+00:00 ― 10 min lire

Traitement de l'audio et de la parole Améliorer l'acoustique des pièces avec des systèmes MIMO

Découvre comment les systèmes MIMO améliorent l'analyse sonore dans différents environnements.

2025-08-31T02:23:45+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans la recherche sur l'acoustique des salles

De nouvelles techniques améliorent l'estimation de la direction du son pour différents réglages audio.

2025-08-31T01:35:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Contrôler le son pour des expériences d'écoute plus claires

Des recherches montrent des astuces pour ajuster le son dans les pièces afin d'améliorer la clarté.

2025-08-31T00:46:35+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Détecter l'humour dans les vidéos avec FunnyNet-W

Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.

2025-08-30T23:09:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Progrès dans les élastomères diélectriques pour la technologie

Les élastomères diélectriques convertissent l'énergie électrique en mouvement mécanique, offrant des applications diverses.

2025-08-30T20:43:40+00:00 ― 9 min lire

Calcul et langage Utiliser la technologie ASR pour aider au diagnostic de la démence

Les transcriptions ASR avec des erreurs peuvent aider à identifier la maladie d'Alzheimer plus précisément.

2025-08-30T16:40:45+00:00 ― 10 min lire

Calcul et langage Présentation d'ELLA-V : Un nouveau chapitre dans la synthèse vocale

ELLA-V améliore la qualité et le contrôle de la synthèse vocale, surpassant les modèles précédents.

2025-08-30T01:17:40+00:00 ― 7 min lire

Méthodes quantitatives Une nouvelle méthode améliore la surveillance acoustique de la faune

Une nouvelle approche améliore la précision de détection des cris d'animaux sans seuils arbitraires.

2025-08-29T23:46:39+00:00 ― 8 min lire

Calcul et langage Faire avancer la classification de la parole avec des données multimodales

Un nouveau modèle intègre l'audio et le texte pour une meilleure classification de la parole.

2025-08-29T18:49:00+00:00 ― 8 min lire

Son Défi NOTSOFAR-1 : Faire avancer la technologie de transcription des réunions

Une nouvelle initiative pour améliorer la technologie de transcription pour les réunions dans les grandes salles.

2025-08-29T16:23:15+00:00 ― 9 min lire

Calcul et langage Avancées dans la correction des erreurs de reconnaissance vocale

De nouvelles méthodes améliorent la précision dans la reconnaissance vocale brouillée en utilisant de grands modèles de langue.

2025-08-29T01:48:45+00:00 ― 8 min lire

Son Comprendre les vocalisations des poules pondeuses pour une meilleure ferme

Analyser les sons des poules aide à améliorer leur santé et la productivité de la ferme.

2025-08-29T00:11:35+00:00 ― 10 min lire

Interaction homme-machine Démêlage du son : un nouvel outil pour la réalité mixte

Une méthode pour aider les malvoyants à reconnaître des sons en réalité mixte.

2025-08-28T20:57:15+00:00 ― 6 min lire

Traitement de l'audio et de la parole S'attaquer aux défis de la technologie de la parole pour les langues sous-resources

Cet article parle des solutions pour les applications de parole dans les langues avec peu de données transcrites.

2025-08-28T18:31:30+00:00 ― 8 min lire

Apprentissage automatique Avancées dans la classification sonore en utilisant des réseaux de croyance projetés

Des chercheurs combinent des méthodes génératives et discriminatives pour améliorer la classification sonore.

2025-08-28T16:05:45+00:00 ― 7 min lire