Cet article explore un nouveau modèle pour l'identification de l'intention de discours et des slots.
― 8 min lire
La science de pointe expliquée simplement
Cet article explore un nouveau modèle pour l'identification de l'intention de discours et des slots.
― 8 min lire
Un nouveau modèle améliore la reconnaissance vocale dans des environnements bruyants en se concentrant sur un seul locuteur.
― 5 min lire
Les modèles de langue modernes améliorent la précision et la qualité de la normalisation du texte.
― 5 min lire
La famille Nemotron-4 340B propose des modèles puissants pour des applications diverses et la génération de données synthétiques.
― 10 min lire
Un nouveau modèle améliore la clarté de la voix en s'attaquant au bruit et aux échos.
― 8 min lire
NEST propose une approche plus rapide et efficace pour les tâches de parole auto-supervisées.
― 7 min lire
Sortformer intègre la diarisation des locuteurs et l'ASR pour un meilleur traitement audio.
― 6 min lire
Explorer le défi GenSEC pour améliorer la précision de la transcription vocale.
― 6 min lire
Un nouveau cadre simplifie la reconnaissance vocale dans des environnements bruyants.
― 6 min lire
Une nouvelle méthode pour les modèles de langage parlés réduit le besoin de données massives.
― 8 min lire
NeKo améliore la communication entre machines en corrigeant les erreurs de parole, de traduction et de texte.
― 8 min lire
Star Attention améliore la façon dont les modèles linguistiques gèrent les longues séquences de texte.
― 6 min lire