Une approche économe en ressources pour les attaques par porte dérobée sur des modèles d'apprentissage automatique avancés.
― 7 min lire
La science de pointe expliquée simplement
Une approche économe en ressources pour les attaques par porte dérobée sur des modèles d'apprentissage automatique avancés.
― 7 min lire
Exploiter des modèles à sortie anticipée pour un apprentissage fédéré efficace dans les systèmes ASR.
― 12 min lire
Les modèles de langage de débruitage améliorent la correction des erreurs dans les systèmes de reconnaissance vocale en utilisant des données synthétiques.
― 10 min lire
Le nouveau modèle VPIDM améliore la clarté de la parole dans des environnements bruyants.
― 8 min lire
Une étude sur les robots de bureau utilisant des technologies de reconnaissance vocale et visuelle.
― 16 min lire
De nouvelles méthodes améliorent les prédictions des modèles de langage selon les conditions d'entrée.
― 8 min lire
Un nouveau modèle améliore la reconnaissance vocale en utilisant plusieurs méthodes de décodage.
― 9 min lire
Une nouvelle méthode pour tester la sécurité des modèles de langage et leurs compétences multilingues.
― 10 min lire
Une nouvelle stratégie de défense pour les LLM contre les attaques backdoor.
― 7 min lire
Une nouvelle méthode combine des caractéristiques acoustiques et des scores de confiance pour une meilleure correction des erreurs.
― 6 min lire
Cette étude présente un ensemble de données et une méthode pour améliorer la précision de la reconnaissance vocale chinoise en utilisant le Pinyin.
― 9 min lire
Cette étude évalue la technologie de la parole dans des langues à faibles ressources comme l'arabe tunisien.
― 6 min lire
Emilia propose un dataset varié pour améliorer les modèles de génération de discours.
― 8 min lire
Cet article parle des moyens d'améliorer le formatage des expressions numériques dans les transcriptions automatiques.
― 7 min lire
Un nouveau modèle vise à améliorer la qualité de la traduction vocale grâce à des systèmes intégrés.
― 7 min lire
Les modèles d'IA améliorent la précision des conversions de la parole en texte.
― 6 min lire
La recherche améliore les systèmes ASR en utilisant des modèles de langage pour une meilleure précision.
― 9 min lire
Une méthode pour améliorer la qualité de la reconnaissance vocale dans des environnements bruyants.
― 8 min lire
Une nouvelle méthode améliore les recherches de produits à travers différents formats de médias.
― 7 min lire
SAGE-RT crée des données synthétiques pour améliorer les évaluations de la sécurité des modèles linguistiques.
― 7 min lire
De nouvelles méthodes améliorent les évaluations de la qualité vocale pour les patients ayant des problèmes au niveau du système vocal.
― 7 min lire
Un aperçu de la mesure de la précision dans les systèmes de reconnaissance vocale avec de nouvelles méthodes.
― 7 min lire
Une nouvelle méthode améliore la précision de la reconnaissance vocale en utilisant des modèles de langue pour de meilleures transcriptions.
― 5 min lire
De nouvelles méthodes améliorent la reconnaissance vocale dans des situations difficiles avec plusieurs intervenants.
― 6 min lire
Une nouvelle méthode utilise des données vocales pour améliorer les évaluations de l'autisme.
― 7 min lire
La recherche sur les systèmes ASR modulaires vise à améliorer les performances dans des environnements bruyants.
― 5 min lire
Sortformer intègre la diarisation des locuteurs et l'ASR pour un meilleur traitement audio.
― 6 min lire
Une nouvelle approche améliore la reconnaissance vocale en se concentrant sur des détails spécifiques des locuteurs.
― 7 min lire
Un outil facile à utiliser pour peaufiner des modèles de parole sans code compliqué.
― 8 min lire
Un nouveau modèle aide les robots à suivre des instructions humaines floues plus efficacement.
― 7 min lire
CADA-GAN améliore la performance des systèmes ASR dans différents environnements d'enregistrement.
― 7 min lire
Une nouvelle méthode améliore les interactions vocales en intégrant les processus de reconnaissance et de réponse.
― 6 min lire
Un aperçu des résultats du défi Codec-SUPERB et des métriques de performance des codecs.
― 6 min lire
Un projet améliore la reconnaissance vocale pour la langue Malasar en utilisant des ressources tamoules.
― 6 min lire
Mamba améliore la reconnaissance vocale avec rapidité et précision, redéfinissant l'interaction avec les appareils.
― 5 min lire
Ce projet vise à standardiser les dialectes bengalis pour une communication plus claire.
― 7 min lire
Un nouveau système ASR améliore la reconnaissance vocale médicale pour un soin des patients précis.
― 8 min lire
Suit à des conférenciers dans des environnements multilingues grâce à la reconnaissance vocale automatique.
― 8 min lire
Un nouveau modèle améliore significativement la précision de la reconnaissance vocale chinoise.
― 7 min lire
Efforts pour documenter et préserver la langue néo-araméenne en danger.
― 7 min lire