Sriram Ganapathy

Des recherches montrent que les frontières des mots jouent un rôle dans la parole et l'activité EEG.

2025-10-14T11:59:25+00:00 ― 8 min lire

Une nouvelle méthode améliore la reconnaissance vocale en utilisant seulement des données audio brutes.

2025-10-09T02:26:05+00:00 ― 7 min lire

Intégrer des métadonnées améliore les performances dans des tâches de parole comme l'identification de langue.

2025-10-06T12:05:10+00:00 ― 8 min lire

Combiner des modèles de base et spécialisés renforce les capacités de l'IA de manière efficace.

2025-09-18T23:14:24+00:00 ― 7 min lire

De nouvelles méthodes combinent l'audio et les métadonnées pour une meilleure reconnaissance des langues.

2025-09-08T07:09:30+00:00 ― 7 min lire

Apprends comment la dé-réverbération améliore la reconnaissance vocale dans des environnements bruyants.

2025-09-05T12:45:40+00:00 ― 6 min lire

E-SHARC améliore l'identification des locuteurs dans différents environnements audio.

2025-08-28T06:22:45+00:00 ― 7 min lire

Cet article présente un système à double encodeur pour un apprentissage efficace de la représentation de la parole.

2025-07-24T01:50:20+00:00 ― 7 min lire

Une nouvelle méthode améliore la gestion des accents différents par les systèmes ASR grâce à des codebooks spécialisés.

2025-07-22T04:29:40+00:00 ― 6 min lire

Un nouveau critère aide à évaluer les tokenizeurs de discours pour de meilleures performances.

2025-06-20T00:01:10+00:00 ― 8 min lire

Une nouvelle méthode combine le sens et le son pour une détection d’émotion améliorée dans la parole.

2025-06-16T16:40:00+00:00 ― 8 min lire

De nouvelles méthodes améliorent la compréhension des prédictions des modèles d'IA.

2025-06-08T13:31:25+00:00 ― 8 min lire

On examine comment nos cerveaux traitent le son et la parole dans différentes situations.

2025-05-10T20:35:30+00:00 ― 6 min lire