Derniers articles pour ASR

Cryptographie et sécurité Nouvelle méthode d'attaque par porte dérobée pour les gros modèles d'IA

Une approche économe en ressources pour les attaques par porte dérobée sur des modèles d'apprentissage automatique avancés.

2025-08-07T00:01:36+00:00 ― 7 min lire

Calcul et langage Avancées dans l'apprentissage fédéré pour la reconnaissance vocale

Exploiter des modèles à sortie anticipée pour un apprentissage fédéré efficace dans les systèmes ASR.

2025-08-06T09:48:24+00:00 ― 12 min lire

Apprentissage automatique Avancées dans la reconnaissance automatique de la parole avec des modèles de langage de débruitage

Les modèles de langage de débruitage améliorent la correction des erreurs dans les systèmes de reconnaissance vocale en utilisant des données synthétiques.

2025-08-03T22:34:10+00:00 ― 10 min lire

Traitement de l'audio et de la parole Avancées dans l'amélioration de la parole avec VPIDM

Le nouveau modèle VPIDM améliore la clarté de la parole dans des environnements bruyants.

2025-08-03T16:54:05+00:00 ― 8 min lire

Robotique Avancées dans les robots de bureau

Une étude sur les robots de bureau utilisant des technologies de reconnaissance vocale et visuelle.

2025-08-03T13:39:45+00:00 ― 16 min lire

Calcul et langage Améliorer la stabilité des modèles de langage contre les attaques

De nouvelles méthodes améliorent les prédictions des modèles de langage selon les conditions d'entrée.

2025-08-03T07:56:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Présentation du modèle 4D dans la reconnaissance vocale

Un nouveau modèle améliore la reconnaissance vocale en utilisant plusieurs méthodes de décodage.

2025-08-01T01:44:35+00:00 ― 9 min lire

Intelligence artificielle Nouvelle approche pour évaluer les modèles multilingues

Une nouvelle méthode pour tester la sécurité des modèles de langage et leurs compétences multilingues.

2025-07-28T02:37:54+00:00 ― 10 min lire

Intelligence artificielle Atténuer les attaques par porte dérobée dans les modèles de langage

Une nouvelle stratégie de défense pour les LLM contre les attaques backdoor.

2025-07-26T23:22:36+00:00 ― 7 min lire

Calcul et langage Améliorer la correction des erreurs de parole dans les systèmes de reconnaissance vocale

Une nouvelle méthode combine des caractéristiques acoustiques et des scores de confiance pour une meilleure correction des erreurs.

2025-07-25T20:45:15+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance vocale chinoise grâce à la régularisation du pinyin

Cette étude présente un ensemble de données et une méthode pour améliorer la précision de la reconnaissance vocale chinoise en utilisant le Pinyin.

2025-07-25T07:47:55+00:00 ― 9 min lire

Calcul et langage Avancer la technologie de la parole pour l'arabe tunisien

Cette étude évalue la technologie de la parole dans des langues à faibles ressources comme l'arabe tunisien.

2025-07-21T12:18:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Présentation d'Emilia : un nouveau jeu de données pour la génération de discours

Emilia propose un dataset varié pour améliorer les modèles de génération de discours.

2025-07-20T09:34:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Amélioration de la mise en forme des chiffres dans les transcriptions ASR

Cet article parle des moyens d'améliorer le formatage des expressions numériques dans les transcriptions automatiques.

2025-07-14T15:55:35+00:00 ― 7 min lire

Calcul et langage Avancées dans la technologie de traduction vocale

Un nouveau modèle vise à améliorer la qualité de la traduction vocale grâce à des systèmes intégrés.

2025-07-11T02:54:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec la collaboration de l'IA

Les modèles d'IA améliorent la précision des conversions de la parole en texte.

2025-07-07T09:50:10+00:00 ― 6 min lire

Calcul et langage Améliorer la reconnaissance vocale pour des termes spécialisés

La recherche améliore les systèmes ASR en utilisant des modèles de langage pour une meilleure précision.

2025-07-06T20:41:12+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale avec l'apprentissage de la représentation du bruit contextuel

Une méthode pour améliorer la qualité de la reconnaissance vocale dans des environnements bruyants.

2025-07-01T23:28:15+00:00 ― 8 min lire

Multimédia Avancées dans la recherche de produits en e-commerce

Une nouvelle méthode améliore les recherches de produits à travers différents formats de médias.

2025-07-01T08:45:24+00:00 ― 7 min lire

Intelligence artificielle SAGE-RT : Une nouvelle méthode pour la sécurité des modèles de langage

SAGE-RT crée des données synthétiques pour améliorer les évaluations de la sécurité des modèles linguistiques.

2025-06-28T06:37:42+00:00 ― 7 min lire

Son Avancées dans l'évaluation de la qualité vocale grâce à la technologie

De nouvelles méthodes améliorent les évaluations de la qualité vocale pour les patients ayant des problèmes au niveau du système vocal.

2025-06-26T07:26:15+00:00 ― 7 min lire

Calcul et langage Évaluer la précision de la reconnaissance vocale automatique

Un aperçu de la mesure de la précision dans les systèmes de reconnaissance vocale avec de nouvelles méthodes.

2025-06-22T20:50:45+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance automatique de la parole avec des modèles de langue

Une nouvelle méthode améliore la précision de la reconnaissance vocale en utilisant des modèles de langue pour de meilleures transcriptions.

2025-06-21T20:33:15+00:00 ― 5 min lire

Son Avancées dans la reconnaissance vocale multi-locuteurs

De nouvelles méthodes améliorent la reconnaissance vocale dans des situations difficiles avec plusieurs intervenants.

2025-06-20T21:52:55+00:00 ― 6 min lire

Calcul et langage Utiliser les données vocales pour diagnostiquer l'autisme

Une nouvelle méthode utilise des données vocales pour améliorer les évaluations de l'autisme.

2025-06-19T19:12:12+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance automatique de la parole avec la modularité

La recherche sur les systèmes ASR modulaires vise à améliorer les performances dans des environnements bruyants.

2025-06-16T17:28:35+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale avec Sortformer

Sortformer intègre la diarisation des locuteurs et l'ASR pour un meilleur traitement audio.

2025-06-15T09:05:15+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale dans des environnements avec plusieurs locuteurs

Une nouvelle approche améliore la reconnaissance vocale en se concentrant sur des détails spécifiques des locuteurs.

2025-06-11T17:38:15+00:00 ― 7 min lire

Son ESPnet-EZ : Simplifier le développement de modèles de parole

Un outil facile à utiliser pour peaufiner des modèles de parole sans code compliqué.

2025-06-11T15:12:30+00:00 ― 8 min lire

Robotique Améliorer la reconnaissance vocale des robots pour mieux collaborer

Un nouveau modèle aide les robots à suivre des instructions humaines floues plus efficacement.

2025-06-11T14:53:18+00:00 ― 7 min lire

Son Améliorer la reconnaissance automatique de la parole avec CADA-GAN

CADA-GAN améliore la performance des systèmes ASR dans différents environnements d'enregistrement.

2025-06-07T23:45:30+00:00 ― 7 min lire

Calcul et langage Faire avancer la reconnaissance vocale avec des techniques implicites

Une nouvelle méthode améliore les interactions vocales en intégrant les processus de reconnaissance et de réponse.

2025-06-06T03:21:12+00:00 ― 6 min lire

Traitement de l'audio et de la parole Évaluer les codecs audio neuronaux : Avis du défi Codec-SUPERB

Un aperçu des résultats du défi Codec-SUPERB et des métriques de performance des codecs.

2025-06-05T06:58:50+00:00 ― 6 min lire

Calcul et langage Innovation de la reconnaissance vocale pour la langue Malasar

Un projet améliore la reconnaissance vocale pour la langue Malasar en utilisant des ressources tamoules.

2025-05-23T02:48:37+00:00 ― 6 min lire

Son Mamba : Avancer la technologie de reconnaissance vocale

Mamba améliore la reconnaissance vocale avec rapidité et précision, redéfinissant l'interaction avec les appareils.

2025-05-19T22:39:54+00:00 ― 5 min lire

Calcul et langage Relier les dialectes bangladais : une approche unifiée

Ce projet vise à standardiser les dialectes bengalis pour une communication plus claire.

2025-05-12T19:19:18+00:00 ― 7 min lire

Traitement de l'audio et de la parole United-MedASR : Améliorer la reconnaissance vocale médicale

Un nouveau système ASR améliore la reconnaissance vocale médicale pour un soin des patients précis.

2025-04-30T00:58:50+00:00 ― 8 min lire

Calcul et langage Une nouvelle méthode pour la reconnaissance vocale avec attribution au locuteur

Suit à des conférenciers dans des environnements multilingues grâce à la reconnaissance vocale automatique.

2025-04-20T15:33:18+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale avec le Pinyin

Un nouveau modèle améliore significativement la précision de la reconnaissance vocale chinoise.

2025-04-15T08:10:03+00:00 ― 7 min lire

Calcul et langage Sauver le néo-araméen : une langue en danger

Efforts pour documenter et préserver la langue néo-araméenne en danger.

2025-04-13T14:26:15+00:00 ― 7 min lire