Génie électrique et science des systèmes - Traitement de l'audio et de la parole

Son Explorer le son grâce à l'informatique quantique

Découvrez comment l'informatique quantique redéfinit la créativité musicale avec le Variational Quantum Harmonizer.

2025-06-10T00:10:24+00:00 ― 15 min lire

Traitement de l'audio et de la parole Améliorer la clarté de la parole avec le modèle MCMamba

Le modèle MCMamba améliore la qualité de la parole dans des environnements bruyants en utilisant des infos spatiales et spectraales.

2025-06-09T21:54:45+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'amélioration de la parole à faible latence

Cette étude évalue des méthodes à faible latence pour améliorer la qualité du son dans des conditions bruyantes.

2025-06-09T20:17:35+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Impact de la représentation des gestes sur les agents virtuels

Examen de comment les gestes 2D et 3D influencent la communication des personnages virtuels.

2025-06-09T19:29:00+00:00 ― 10 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance des locuteurs dans des environnements bruyants

Une étude sur l'amélioration des systèmes de reconnaissance vocale dans des environnements bruyants.

2025-06-09T18:40:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole L'avenir de la santé : Analyse de la parole dans la détection des maladies

Des chercheurs utilisent la parole pour identifier et surveiller différentes conditions de santé.

2025-06-09T17:51:50+00:00 ― 11 min lire

Traitement de l'audio et de la parole RF-GML : Une nouvelle approche de la qualité audio

RF-GML mesure la qualité audio sans avoir besoin d'un signal de référence.

2025-06-09T16:14:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la qualité du son grâce à l'égalisation des chambres

Apprends comment l'égalisation de la pièce améliore les expériences audio dans différents environnements.

2025-06-09T14:37:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la synthèse vocale avec StyleTTS-ZS

StyleTTS-ZS propose une synthèse vocale efficace et de haute qualité sans avoir besoin de former beaucoup les intervenants.

2025-06-09T13:00:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Approche innovante pour la synthèse de voix chantées en ensemble

Une nouvelle méthode améliore le chant d'ensemble synthétisé en modélisant les interactions entre les chanteurs.

2025-06-09T11:23:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale grâce à une pensée humaine

Un nouveau cadre améliore la reconnaissance vocale en modélisant efficacement les relations sonores.

2025-06-09T07:20:15+00:00 ― 6 min lire

Calcul et langage Amélioration des modèles avec le réglage des préférences

Apprends comment le réglage des préférences aligne les modèles avec les retours des humains.

2025-06-09T04:54:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de conversion vocale

Une nouvelle méthode de masquage améliore la conversion vocale en séparant l'identité du locuteur de la phonétique.

2025-06-09T04:05:55+00:00 ― 7 min lire

Son Améliorer les modèles musique-texte grâce à la qualité des données

Des techniques innovantes améliorent l'entraînement des modèles musique-texte avec des ressources limitées.

2025-06-09T00:03:00+00:00 ― 9 min lire

Son Approches innovantes dans le marquage audio pour la musique du monde

De nouvelles méthodes améliorent le balisage audio pour des styles musicaux divers et la préservation culturelle.

2025-06-08T17:34:20+00:00 ― 8 min lire

Son Nouveau jeu de données vise à améliorer la technologie des maisons intelligentes pour les seniors

Un ensemble de sons de maison favorise la sécurité et le confort des personnes âgées.

2025-06-08T16:45:45+00:00 ― 6 min lire

Son Présentation de SD-Codec : Un nouveau codec audio pour une meilleure gestion du son

Le SD-Codec améliore le traitement audio en séparant efficacement les différents types de sons.

2025-06-08T14:20:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour les accents

Cet article parle des méthodes pour améliorer la reconnaissance vocale pour les discours accentués.

2025-06-08T12:42:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la détection de la fraude vocale avec des méthodes explicables

Une nouvelle méthode améliore l'interprétabilité de la détection de discours truqué.

2025-06-08T11:05:40+00:00 ― 6 min lire

Son Avancées dans la technologie de synthèse vocale

Un aperçu du nouveau système TTS à une seule étape qui améliore la génération de la parole.

2025-06-08T09:28:30+00:00 ― 8 min lire

Calcul et langage Améliorer les modèles de langue audio pour le thaï et l'anglais

Cette étude aborde les défis des modèles audio pour les langues à faibles ressources.

2025-06-08T08:39:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance des émotions dans les langues à ressources limitées

Cette étude améliore les systèmes de reconnaissance des émotions pour les langues moins courantes en utilisant des données à forte ressource.

2025-06-08T07:51:20+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de parole multilingue

Un modèle améliore les tâches de parole dans des environnements multilingues, en s'attaquant aux défis du code-switching.

2025-06-08T06:14:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les systèmes de TTS pour les langues indiennes

Améliorer la synthèse vocale dans les langues indiennes en utilisant des unités inter-pausales.

2025-06-08T02:59:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole DeFT-Mamba : Faire avancer les techniques de séparation sonore

DeFT-Mamba améliore la séparation et la classification des sons dans des environnements bruyants.

2025-06-08T01:22:40+00:00 ― 6 min lire

Son Améliorer la reconnaissance automatique de la parole avec CADA-GAN

CADA-GAN améliore la performance des systèmes ASR dans différents environnements d'enregistrement.

2025-06-07T23:45:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole EVA : Une nouvelle ère dans la reconnaissance vocale audiovisuelle

EVA combine des signaux audio et visuels pour une meilleure précision de reconnaissance vocale.

2025-06-07T22:08:20+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale pour les scénarios avec plusieurs interlocuteurs

Un nouveau cadre simplifie la reconnaissance vocale dans des environnements bruyants.

2025-06-07T20:31:10+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconnaissance vocale audio-visuelle

Llama-AVSR combine l'audio et les visuels pour améliorer la précision de la reconnaissance vocale.

2025-06-07T18:05:25+00:00 ― 8 min lire

Son Renforcer la sécurité audio avec WMCodec

WMCodec améliore le marquage audio pour plus de sécurité et d'authenticité.

2025-06-07T14:02:30+00:00 ― 6 min lire

Son Faire avancer la classification des scènes acoustiques dans le défi DCASE 2024

De nouveaux modèles s'attaquent à la classification sonore avec peu de données d'entraînement.

2025-06-07T12:25:20+00:00 ― 7 min lire

Son Avancées dans les méthodes de détection de faux audio

Une nouvelle méthode améliore la détection des faux audios en utilisant des modèles préentraînés.

2025-06-07T11:36:45+00:00 ― 7 min lire

Son Avancées dans la technologie de synthèse vocale

Une nouvelle méthode améliore la qualité et l'efficacité de la génération de discours.

2025-06-07T10:48:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la localisation sonore dans des environnements bruyants

Une méthode qui combine des données étiquetées et non étiquetées améliore la détection des sources sonores.

2025-06-07T09:11:00+00:00 ― 7 min lire

Son Le Rôle du Son dans la Performance au Tennis de Table

Découvrez comment les sons aident les joueurs de ping-pong.

2025-06-07T07:33:50+00:00 ― 7 min lire

Son Avancées dans la musique orchestrale générée par ordinateur

Un système qui met la mélodie en avant tout en permettant de contrôler la génération de musique orchestrale.

2025-06-07T06:45:15+00:00 ― 7 min lire

Son Avancées dans les systèmes de feedback pour l'apprentissage des langues

Une nouvelle méthode utilise l'ombre virtuelle pour améliorer le retour sur la prononciation des apprenants en langues.

2025-06-07T05:56:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans les techniques audio binaurales

De nouvelles méthodes améliorent la qualité audio binaurale dans des environnements sonores difficiles.

2025-06-07T04:19:30+00:00 ― 10 min lire

Apprentissage automatique Avancées dans la Reconnaissance Vocale pour les Enfants

Une nouvelle méthode ASR aide la technologie à mieux comprendre la parole des enfants.

2025-06-06T20:13:40+00:00 ― 7 min lire

Son Compositeur : Une nouvelle façon de créer de la musique à partir des mots

Le compositeur utilise des invites textuelles pour créer des compositions musicales complexes en format MIDI.

2025-06-06T12:07:50+00:00 ― 7 min lire