Jagadeesh Balam

Cet article explore les avancées en diarisation des locuteurs en utilisant des modèles de langue pour plus de précision.

2025-09-14T03:14:25+00:00 ― 6 min lire

Un nouveau modèle améliore la clarté de la voix en s'attaquant au bruit et aux échos.

2025-07-12T15:20:35+00:00 ― 8 min lire

NEST propose une approche plus rapide et efficace pour les tâches de parole auto-supervisées.

2025-06-25T20:06:05+00:00 ― 7 min lire

Sortformer intègre la diarisation des locuteurs et l'ASR pour un meilleur traitement audio.

2025-06-15T09:05:15+00:00 ― 6 min lire

Explorer le défi GenSEC pour améliorer la précision de la transcription vocale.

2025-06-10T18:57:55+00:00 ― 6 min lire

Un nouveau cadre simplifie la reconnaissance vocale dans des environnements bruyants.

2025-06-07T20:31:10+00:00 ― 6 min lire

Une nouvelle méthode pour les modèles de langage parlés réduit le besoin de données massives.

2025-05-29T17:50:26+00:00 ― 8 min lire

NeKo améliore la communication entre machines en corrigeant les erreurs de parole, de traduction et de texte.

2025-05-22T13:26:47+00:00 ― 8 min lire