Derniers articles pour Technologie de la parole

Son Améliorer la détection du bégaiement avec MMSD-Net

Une nouvelle méthode améliore la détection du bégaiement en combinant des données audio, vidéo et textuelles.

2025-07-15T07:18:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour la langue polonaise

La recherche présente de nouvelles méthodes pour évaluer les systèmes de reconnaissance vocale en polonais.

2025-07-14T16:44:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole MSceneSpeech : Faire avancer la synthèse vocale en mandarin

Un nouveau jeu de données améliore la parole des machines pour le mandarin, visant une expression naturelle.

2025-07-14T09:26:55+00:00 ― 7 min lire

Son L'essor du montage vocal dans les médias numériques

Explore l'importance croissante du montage audio pour les créateurs de contenu.

2025-07-11T00:28:35+00:00 ― 7 min lire

Calcul et langage Avancées dans la reconnaissance vocale pour les langues à ressources limitées

De nouvelles méthodes améliorent les systèmes de parole pour les langues sous-représentées.

2025-07-10T04:14:00+00:00 ― 7 min lire

Son Avancées dans les technologies de détection vocale

La recherche combine l'amélioration de la parole et l'apprentissage par transfert pour de meilleurs systèmes anti-fraude.

2025-07-08T23:53:35+00:00 ― 10 min lire

Traitement de l'audio et de la parole Avancées dans la génération de discours émotionnel

De nouvelles méthodes améliorent l'expression émotionnelle dans la synthèse vocale des machines.

2025-07-05T22:12:30+00:00 ― 8 min lire

Calcul et langage Présentation de Speech-MASSIVE : un nouveau dataset pour la compréhension du langage parlé multilingue

Speech-MASSIVE vise à améliorer la compréhension de la langue parlée dans différentes langues.

2025-07-04T01:40:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole Assurer la confidentialité des données vocales avec de nouvelles méthodes

Des techniques innovantes protègent les données vocales sensibles tout en gardant la précision du traitement.

2025-07-04T00:51:50+00:00 ― 9 min lire

Interaction homme-machine OpenOmni : Faire avancer les agents de conversation multimodaux

OpenOmni crée des outils flexibles pour créer et tester des agents conversationnels.

2025-07-01T09:40:42+00:00 ― 10 min lire

Traitement de l'audio et de la parole Progrès dans la technologie de synthèse vocale avec le SSL-TTS

SSL-TTS simplifie la synthèse vocale en utilisant peu de données d'entraînement pour des résultats de haute qualité.

2025-06-27T15:49:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de reconnaissance de la parole chuchotée

De nouvelles méthodes améliorent la reconnaissance vocale pour la communication chuchotée.

2025-06-25T05:31:35+00:00 ― 7 min lire

Son StyleSpeech : L'avenir de la technologie texte-à-parole

StyleSpeech fait avancer les systèmes TTS en capturant les nuances de la parole naturelle.

2025-06-24T14:08:30+00:00 ― 7 min lire

Son EmoAttack : Une nouvelle menace dans la technologie de la parole

EmoAttack utilise la conversion vocale émotionnelle pour exploiter les failles des systèmes de parole.

2025-06-24T01:59:45+00:00 ― 7 min lire

Traitement de l'audio et de la parole Faire avancer la conversion de la parole chuchotée avec MaskCycleGAN

Une nouvelle méthode améliore la conversion de la parole chuchotée en parole normale en utilisant des techniques avancées.

2025-06-23T09:48:05+00:00 ― 6 min lire

Son VoxInstruct : Une nouvelle façon de générer de la parole

VoxInstruct combine le contenu et le style pour une génération de discours plus naturelle.

2025-06-22T23:16:30+00:00 ― 6 min lire

Son Avancées dans la vérification des locuteurs avec Whisper

Une nouvelle méthode améliore la précision de la reconnaissance vocale dans plusieurs langues.

2025-06-22T18:25:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans l'amélioration de la parole avec fenêtrage temporel contextuel

Explorer une nouvelle approche pour améliorer la qualité de la parole en utilisant des fenêtres temporelles contextuelles.

2025-06-22T17:36:25+00:00 ― 7 min lire

Son Avancées dans la technologie de synthèse vocale

De nouvelles méthodes améliorent la qualité de la synthèse vocale dans les systèmes TTS.

2025-06-22T05:27:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Présentation de SelectTTS : Une méthode de synthèse vocale simplifiée

SelectTTS simplifie la génération de voix pour des intervenants inconnus grâce à une sélection de cadres efficace.

2025-06-21T18:07:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Progrès dans l'apprentissage auto-supervisé pour le traitement de la parole

Une nouvelle méthode améliore les performances des modèles de discours dans différentes tâches.

2025-06-21T02:44:25+00:00 ― 8 min lire

Son Améliorer la détection de mots clés avec des données non étiquetées

Une nouvelle méthode améliore la précision de la détection de mots-clés en utilisant des données audio non étiquetées.

2025-06-21T01:55:50+00:00 ― 9 min lire

Neurones et cognition Détection automatique du léger déclin cognitif grâce à l'analyse de la parole

Des recherches montrent que l'analyse de la parole peut aider à la détection précoce des troubles cognitifs légers.

2025-06-21T01:11:33+00:00 ― 7 min lire

Son Nouveau jeu de données améliore la technologie de reconnaissance vocale

Des chercheurs ont créé LibriheavyMix pour améliorer la reconnaissance vocale dans des environnements bruyants.

2025-06-20T22:41:30+00:00 ― 6 min lire

Calcul et langage Avancées dans la tokenisation de la parole : un cadre d'évaluation

Un nouveau critère aide à évaluer les tokenizeurs de discours pour de meilleures performances.

2025-06-20T00:01:10+00:00 ― 8 min lire

Calcul et langage Utiliser les données vocales pour diagnostiquer l'autisme

Une nouvelle méthode utilise des données vocales pour améliorer les évaluations de l'autisme.

2025-06-19T19:12:12+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la synthèse vocale utilisant DDSP

Découvrez comment DDSP améliore l'efficacité et la qualité de la synthèse vocale.

2025-06-18T17:15:00+00:00 ― 8 min lire

Calcul et langage Défis dans la reconnaissance des locuteurs pour les modèles de langage parlé

Les LLMs de discours montrent du potentiel mais galèrent avec l'identification des intervenants dans les conversations.

2025-06-17T08:03:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Entraînement efficace des modèles de voix avec des ressources limitées

Cet article parle des méthodes d'entraînement efficaces pour les modèles de parole en utilisant l'apprentissage auto-supervisé.

2025-06-16T15:02:50+00:00 ― 6 min lire

Calcul et langage Améliorer les systèmes de parole pour les langues indiennes

Un nouveau jeu de données améliore la technologie de la parole multilingue en Inde.

2025-06-15T18:48:15+00:00 ― 7 min lire

Son Avancées dans la technologie de synthèse vocale émotionnelle

ParaEVITS améliore l'expression émotionnelle dans la synthèse vocale grâce à un guidage en langage naturel.

2025-06-15T05:50:55+00:00 ― 6 min lire

Calcul et langage Avancer la reconnaissance vocale pour la langue faetar

Efforts pour améliorer la technologie de la parole pour la langue Faetar, qui est sous-resources.

2025-06-13T09:18:50+00:00 ― 6 min lire

Calcul et langage WhisperNER : Fusion de la reconnaissance vocale et de la détection d'entités

Un nouveau modèle combine la reconnaissance vocale et la reconnaissance d'entités pour de meilleurs résultats.

2025-06-13T03:29:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour les personnes avec des troubles

Un projet vise à améliorer la technologie de la parole pour ceux qui ont des difficultés de communication.

2025-06-12T12:15:40+00:00 ― 7 min lire

Son Améliorer les accents dans la technologie de synthèse vocale

Un nouveau système améliore la précision des accents dans la synthèse vocale pour une meilleure communication.

2025-06-12T08:12:45+00:00 ― 7 min lire

Son ESPnet-EZ : Simplifier le développement de modèles de parole

Un outil facile à utiliser pour peaufiner des modèles de parole sans code compliqué.

2025-06-11T15:12:30+00:00 ― 8 min lire

Physique quantique Faire avancer la reconnaissance vocale avec l'informatique quantique

Une nouvelle méthode qui améliore la reconnaissance vocale tout en garantissant la confidentialité des données.

2025-06-11T07:18:42+00:00 ― 6 min lire

Son Avancées dans les techniques de conversion d'accent

Une nouvelle méthode pour générer de la parole accentuée en utilisant la translittération du texte.

2025-06-11T06:18:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la qualité du son avec Wave-U-Mamba

Wave-U-Mamba améliore les enregistrements vocaux de mauvaise qualité pour une communication plus claire.

2025-06-11T04:40:55+00:00 ― 6 min lire

Son Avancées dans l'évaluation de la qualité de la parole

Un nouveau système prédit des scores de naturel pour la parole synthétique en utilisant des méthodes innovantes.

2025-06-11T03:52:20+00:00 ― 7 min lire