Derniers articles pour Technologie de la parole

Son DiCon : Une nouvelle approche de la synthèse vocale

Présentation d'une méthode plus rapide pour la synthèse vocale de haute qualité utilisant des modèles de diffusion.

2025-09-09T03:24:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole HiFTNet : Faire avancer la technologie de synthèse vocale

HiFTNet propose une synthèse vocale rapide et de haute qualité en utilisant des techniques innovantes et efficaces.

2025-09-09T02:35:30+00:00 ― 6 min lire

Son Améliorer la reconnaissance vocale avec l'entraînement au moment du test

Explore comment TTT améliore la reconnaissance vocale en s'adaptant aux changements de distribution.

2025-09-08T14:26:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Présentation du modèle SPGM pour la séparation de la parole

Un nouveau modèle améliore l'efficacité et la performance de la séparation des voix.

2025-09-07T10:54:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec des techniques d'augmentation audio

Une étude montre que l'augmentation audio peut améliorer la reconnaissance vocale dans les langues à faibles ressources.

2025-09-06T09:48:50+00:00 ― 7 min lire

Son Transformer les mouvements de la langue en sons de la parole

Cette étude transforme les données de langue obtenues par IRM en audio de parole réel.

2025-09-04T22:11:10+00:00 ― 5 min lire

Calcul et langage Améliorer la reconnaissance vocale avec l'adaptation de faible rang

Une nouvelle méthode améliore l'efficacité de la reconnaissance vocale en utilisant une adaptation de faible rang.

2025-09-04T00:19:25+00:00 ― 6 min lire

Calcul et langage HyPoradise : Améliorer la précision de la reconnaissance vocale automatique

Un nouveau standard pour améliorer la précision de la reconnaissance vocale avec des modèles de langue.

2025-09-02T23:13:20+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les modèles de synthèse vocale conversationnelle

Une nouvelle approche pour la génération de discours petite, efficace et qui sonne naturel.

2025-08-31T09:41:00+00:00 ― 12 min lire

Calcul et langage Améliorer la reconnaissance vocale avec des données acoustiques

Une nouvelle méthode intègre des infos acoustiques dans les modèles de langage pour améliorer la reconnaissance vocale.

2025-08-25T02:15:55+00:00 ― 11 min lire

Son Capturer le rythme de la parole : une nouvelle méthode

Une nouvelle approche pour synthétiser des voix avec une meilleure précision de rythme.

2025-08-24T23:50:10+00:00 ― 11 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de synthèse vocale

Techniques innovantes pour améliorer les modèles TTS et réduire la perte de connaissances.

2025-08-23T08:09:35+00:00 ― 8 min lire

Son Effets de la taille de lot sur l'entraînement du modèle de parole

Cette étude examine comment la taille des lots influence la performance et l'entraînement des modèles de discours.

2025-08-22T20:00:50+00:00 ― 9 min lire

Traitement de l'audio et de la parole Améliorer les modèles de parole avec RobustDistiller

Une nouvelle méthode améliore la performance et l'efficacité des modèles de parole dans des environnements bruyants.

2025-08-18T05:53:30+00:00 ― 7 min lire

Son Avancées dans les caractéristiques de voix de synthèse vocale

Une étude sur l'amélioration des systèmes TTS avec des échantillons de voix divers.

2025-08-16T12:35:45+00:00 ― 6 min lire

Calcul et langage Classer les sous-dialectes du kurde sorani à travers des données audio

La recherche identifie et classe les dialectes kurdes sorani en utilisant des enregistrements audio extensifs.

2025-08-14T07:57:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la synthèse vocale avec RALL-E

RALL-E améliore la synthèse texte-parole pour un discours plus clair et naturel.

2025-08-13T01:11:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole Faire avancer l'apprentissage audio avec M2D et M2D-X

De nouvelles méthodes améliorent la représentation audio grâce à des techniques d'apprentissage auto-supervisé.

2025-08-12T07:22:50+00:00 ― 8 min lire

Son Améliorations dans la technologie d'édition des attributs vocaux

Nouveau modèle permet un contrôle précis des qualités vocales tout en gardant le contenu.

2025-08-11T18:25:30+00:00 ― 5 min lire

Traitement de l'audio et de la parole Évaluer des modèles de traitement de la parole avec SUPERB

Un nouveau cadre pour évaluer les modèles de base dans les tâches de parole.

2025-08-11T09:31:05+00:00 ― 10 min lire

Interaction homme-machine Réactions des utilisateurs face aux agents de parole adaptatifs

Une étude révèle que les utilisateurs préfèrent les agents vocaux statiques aux agents adaptatifs.

2025-08-11T09:29:30+00:00 ― 10 min lire

Traitement de l'audio et de la parole FlashSpeech : Un bond en avant dans la synthèse vocale

FlashSpeech propose des solutions de synthèse vocale rapides et de haute qualité.

2025-08-10T03:33:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancement de l'extraction de la voix du locuteur dans les médias audio-visuels avec SEANet

SEANet améliore l'isolement des intervenants en réduisant le bruit dans le traitement audio.

2025-08-08T20:47:20+00:00 ― 8 min lire

Traitement de l'audio et de la parole Faire avancer la reconnaissance vocale : Une nouvelle approche d'apprentissage

Une méthode d'apprentissage actif en deux étapes améliore la précision de la reconnaissance vocale avec moins de données.

2025-08-08T02:09:55+00:00 ― 6 min lire

Calcul et langage Évaluation des systèmes de reconnaissance vocale pour la parole bégayée

Cette étude évalue la performance des systèmes de reconnaissance vocale avec des personnes qui bégaient.

2025-08-07T04:18:10+00:00 ― 11 min lire

Calcul et langage Examiner la sécurité des modèles de langage

Cet article examine les vulnérabilités des modèles de discours et les moyens d'améliorer leur sécurité.

2025-08-05T23:09:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de reconnaissance des émotions vocales

De nouvelles méthodes améliorent la façon dont les machines reconnaissent les émotions dans la parole.

2025-08-02T13:22:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Les avancées dans la technologie de synthèse vocale

Seed-TTS crée une voix réaliste à partir de texte pour différentes applications.

2025-08-01T10:39:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la synthèse vocale avec ARDiT

Le nouveau modèle ARDiT améliore la synthèse vocale et l'édition de la parole.

2025-07-31T07:55:45+00:00 ― 7 min lire

Calcul et langage Présentation de mHuBERT-147 : un modèle de parole compact

mHuBERT-147 traite la parole dans plusieurs langues de manière efficace.

2025-07-30T22:12:45+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance automatique de la parole avec le TTA dynamique

De nouvelles méthodes améliorent la reconnaissance vocale dans des environnements bruyants en utilisant des techniques adaptatives.

2025-07-29T13:49:25+00:00 ― 9 min lire

Traitement de l'audio et de la parole Nouveau cadre pour une production de parole claire

Une nouvelle méthode qui optimise l'analyse et la synthèse de la parole en utilisant les mouvements du tractus vocal.

2025-07-28T20:49:10+00:00 ― 9 min lire

Son Améliorer la diarisation des locuteurs avec des embeddings de locuteur

Une étude sur l'amélioration de la segmentation audio en intégrant des embeddings de locuteurs.

2025-07-24T21:16:20+00:00 ― 7 min lire

Calcul et langage Combler le fossé entre les dialectes yorubas

De nouveaux efforts visent à soutenir les dialectes yoruba dans la technologie linguistique.

2025-07-23T15:03:36+00:00 ― 7 min lire

Calcul et langage Wav2Vec2.0 et le son de la reconnaissance vocale

Cet article parle de comment Wav2Vec2.0 traite les sons de la parole en utilisant la phonologie.

2025-07-23T05:35:45+00:00 ― 7 min lire

Calcul et langage Avancer la technologie de la parole pour l'arabe tunisien

Cette étude évalue la technologie de la parole dans des langues à faibles ressources comme l'arabe tunisien.

2025-07-21T12:18:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Amélioration de la synthèse vocale avec le modélisation par sous-centre

Améliorer la synthèse vocale pour une génération de voix plus naturelle et expressive.

2025-07-21T03:23:35+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une nouvelle façon de modifier les sons de la parole

Présentation d'une méthode pour un meilleur contrôle dans l'édition de discours.

2025-07-20T12:49:05+00:00 ― 7 min lire

Traitement de l'audio et de la parole Présentation d'Emilia : un nouveau jeu de données pour la génération de discours

Emilia propose un dataset varié pour améliorer les modèles de génération de discours.

2025-07-20T09:34:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Évaluation de l'efficacité de Mamba dans la technologie de la parole

Mamba montre du potentiel contre les transformers dans les tâches de parole, surtout pour les longues entrées.

2025-07-17T13:33:45+00:00 ― 6 min lire