Shinji Watanabe

Traitement de l'audio et de la parole VoxtLM : Une approche unifiée pour la parole et le texte

VoxtLM combine la reconnaissance vocale, la synthèse, la génération de texte et la continuité dans un seul modèle.

2025-09-13T11:02:45+00:00 ― 5 min lire

Traitement de l'audio et de la parole Présentation d'AV-SUPERB : Une nouvelle référence pour les modèles audio-visuels

AV-SUPERB évalue les modèles audio et visuels sur différentes tâches pour une meilleure performance.

2025-09-08T22:32:35+00:00 ― 7 min lire

Calcul et langage Avancées dans la traduction simultanée de la parole

Améliorer les traductions en temps réel grâce à des méthodes innovantes et des politiques intelligentes.

2025-09-07T17:23:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec de nouvelles techniques

Un aperçu des avancées en reconnaissance vocale pour améliorer la rapidité et la précision.

2025-09-03T21:05:05+00:00 ― 7 min lire

Calcul et langage Avancées dans la traduction vocale grâce au contexte

De nouvelles méthodes améliorent la traduction de la parole en se concentrant sur les informations contextuelles.

2025-09-02T22:24:45+00:00 ― 7 min lire

Son Faire avancer la technologie vocale avec des données de changement de code

Une nouvelle méthode améliore la reconnaissance vocale pour les utilisateurs qui passent d'une langue à l'autre.

2025-09-02T21:36:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une approche universelle pour l'amélioration de la voix

Cette recherche présente un modèle pour améliorer la clarté de la parole dans différentes conditions.

2025-09-02T02:10:10+00:00 ― 7 min lire

Son L'essor du sous-titrage audio automatisé

Explorer les avancées dans le sous-titrage audio automatisé et son impact sur l'accessibilité.

2025-09-02T01:21:35+00:00 ― 6 min lire

Calcul et langage Documenter des langues en danger avec l'IGT

Une nouvelle méthode aide à préserver les langues en danger grâce à une documentation détaillée.

2025-08-27T17:35:42+00:00 ― 10 min lire

Traitement de l'audio et de la parole Évaluer des modèles de traitement de la parole avec SUPERB

Un nouveau cadre pour évaluer les modèles de base dans les tâches de parole.

2025-08-11T09:31:05+00:00 ― 10 min lire

Électrons fortement corrélés États magnétiques dans les quasicristaux icosaédriques

Explorer des états de hérisson et d'anti-hérisson dans des matériaux magnétiques uniques.

2025-08-03T10:24:48+00:00 ― 7 min lire

Traitement de l'audio et de la parole Réduire les interférences pour un son plus clair

Un nouveau système améliore la clarté de la parole dans des environnements avec plusieurs intervenants.

2025-08-02T14:10:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Présentation du modèle 4D dans la reconnaissance vocale

Un nouveau modèle améliore la reconnaissance vocale en utilisant plusieurs méthodes de décodage.

2025-08-01T01:44:35+00:00 ― 9 min lire

Calcul et langage Avancées dans la technologie de reconnaissance vocale automatique

De nouvelles méthodes améliorent la précision et l'efficacité des systèmes de reconnaissance vocale.

2025-07-22T03:41:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole SynesLM : Faire avancer la technologie de la parole audio-visuelle

Un nouveau modèle intègre des données audio et visuelles pour la reconnaissance vocale et la traduction.

2025-07-06T20:04:15+00:00 ― 8 min lire

Calcul et langage Traduction en temps réel : Combler les gaps linguistiques

Ce système traduit la parole anglaise en texte allemand instantanément pour une communication fluid.

2025-06-27T20:53:06+00:00 ― 7 min lire

Immunologie Variants de COVID-19 et Réponses des Vaccins : Ce qu'on sait

De nouvelles variantes de COVID-19 mettent à l'épreuve les vaccins actuels et soulignent la nécessité de continuer les recherches.

2025-06-15T20:20:03+00:00 ― 5 min lire

Son ESPnet-EZ : Simplifier le développement de modèles de parole

Un outil facile à utiliser pour peaufiner des modèles de parole sans code compliqué.

2025-06-11T15:12:30+00:00 ― 8 min lire

Calcul et langage Avancées dans la reconnaissance vocale avec les LLMs

Explorer le défi GenSEC pour améliorer la précision de la transcription vocale.

2025-06-10T18:57:55+00:00 ― 6 min lire

Calcul et langage Avancées dans les systèmes de traduction vocale multilingue

De nouvelles méthodes améliorent la précision et l'efficacité des traductions pour plusieurs langues.

2025-06-10T16:14:30+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de synthèse vocale : alignement des préférences

Découvrez comment l'alignement des préférences améliore les systèmes de synthèse vocale pour de meilleures expériences utilisateurs.

2025-06-10T06:53:36+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale avec les i-vecteurs

Une étude montre que les i-vectors peuvent rivaliser avec des modèles complexes dans la reconnaissance vocale.

2025-06-10T06:49:10+00:00 ― 6 min lire

Traitement de l'audio et de la parole Choix de design impactant la performance des modèles de parole

Une étude sur comment les choix de design impactent les modèles de fond de parole.

2025-06-10T06:00:35+00:00 ― 9 min lire

Traitement de l'audio et de la parole EVA : Une nouvelle ère dans la reconnaissance vocale audiovisuelle

EVA combine des signaux audio et visuels pour une meilleure précision de reconnaissance vocale.

2025-06-07T22:08:20+00:00 ― 5 min lire

Traitement de l'audio et de la parole Évaluer les codecs audio neuronaux : Avis du défi Codec-SUPERB

Un aperçu des résultats du défi Codec-SUPERB et des métriques de performance des codecs.

2025-06-05T06:58:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les codecs neuraux avec ESPnet-Codec

ESPnet-Codec améliore l'entraînement et l'évaluation des codecs neuronaux pour l'audio et la parole.

2025-06-03T03:09:30+00:00 ― 9 min lire

Son Avancées dans la reconnaissance automatique de la parole

De nouvelles méthodes améliorent la façon dont les machines reconnaissent le langage parlé.

2025-04-20T10:37:12+00:00 ― 10 min lire

Son Rencontrez VERSA : Votre Compagnon d'Évaluation Audio

VERSA évalue efficacement la qualité de la parole, de l'audio et de la musique.

2025-01-28T09:33:18+00:00 ― 11 min lire

Traitement de l'audio et de la parole Reconnaissance Vocale Audiovisuelle : Une Nouvelle Frontière

Découvrez comment l'AV-ASR combine audio et visuels pour améliorer la reconnaissance vocale.

2025-01-24T21:39:36+00:00 ― 7 min lire