Hung-yi Lee

Calcul et langage S'attaquer à la confusion des noms dans la génération de texte

Une nouvelle méthode améliore la vérification des faits pour les textes générés par ordinateur avec des noms ambigus.

2025-09-09T17:30:48+00:00 ― 10 min lire

Traitement de l'audio et de la parole Présentation d'AV-SUPERB : Une nouvelle référence pour les modèles audio-visuels

AV-SUPERB évalue les modèles audio et visuels sur différentes tâches pour une meilleure performance.

2025-09-08T22:32:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Reborn : Une nouvelle ère dans l'ASR non supervisé

Reborn propose des solutions innovantes pour la reconnaissance vocale automatique sans données étiquetées.

2025-08-25T19:16:10+00:00 ― 8 min lire

Calcul et langage Faire avancer les modèles linguistiques grâce aux styles de parole

Un nouveau cadre améliore les modèles de langue en reconnaissant et en répondant à différents styles de discours.

2025-08-23T00:03:45+00:00 ― 10 min lire

Traitement de l'audio et de la parole Codec-SUPERB : Un benchmark pour les codecs audio

Un nouveau système pour évaluer la performance des codecs audio dans différentes applis.

2025-08-22T23:15:10+00:00 ― 9 min lire

Traitement de l'audio et de la parole Évaluer des modèles de traitement de la parole avec SUPERB

Un nouveau cadre pour évaluer les modèles de base dans les tâches de parole.

2025-08-11T09:31:05+00:00 ― 10 min lire

Calcul et langage StreamBench : Évaluer les modèles de langage en temps réel

Un nouvel outil pour évaluer l'amélioration continue des modèles de langage grâce aux retours.

2025-07-30T03:52:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance automatique de la parole avec le TTA dynamique

De nouvelles méthodes améliorent la reconnaissance vocale dans des environnements bruyants en utilisant des techniques adaptatives.

2025-07-29T13:49:25+00:00 ― 9 min lire

Calcul et langage Progrès dans les systèmes de dialogue parlé

Une nouvelle méthode améliore le dialogue machine grâce à des données pseudo-stéréo.

2025-07-25T08:36:30+00:00 ― 8 min lire

Calcul et langage Améliorer les modèles de langue avec le cadre DogeRM

DogeRM combine des modèles généraux et spécifiques au domaine pour améliorer efficacement la performance des modèles de langue.

2025-07-21T17:22:18+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec mélange de langues grâce à la distillation de connaissances

Un nouveau cadre améliore la performance de l'ASR en utilisant des données et des ressources limitées.

2025-07-15T22:41:45+00:00 ― 7 min lire

Traitement de l'audio et de la parole Codecs vocaux et préservation des émotions

Examiner comment les codecs gardent les émotions dans les données vocales.

2025-07-12T06:26:10+00:00 ― 7 min lire

Calcul et langage Améliorer les LLM : Le rôle du support utilisateur dans les requêtes SQL

Cet article examine comment l'assistance utilisateur peut améliorer la performance des grands modèles de langage dans la génération de requêtes SQL.

2025-07-09T18:04:30+00:00 ― 6 min lire

Calcul et langage Impact des restrictions de format sur la performance des LLM

Cet article examine comment la génération structurée affecte le raisonnement et la compréhension des modèles de langage.

2025-07-02T00:09:42+00:00 ― 7 min lire

Calcul et langage Évaluer le biais dans les modèles de langage parlé

Un nouveau jeu de données met en lumière les biais dans les modèles de parole en fonction du genre et de l'âge.

2025-06-30T19:07:50+00:00 ― 10 min lire

Traitement de l'audio et de la parole Aperçus sur les neurones dans les modèles de parole

Des recherches montrent comment les neurones dans les modèles de parole reconnaissent les caractéristiques clés du son.

2025-06-17T11:17:25+00:00 ― 9 min lire

Traitement de l'audio et de la parole Entraînement efficace des modèles de voix avec des ressources limitées

Cet article parle des méthodes d'entraînement efficaces pour les modèles de parole en utilisant l'apprentissage auto-supervisé.

2025-06-16T15:02:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance des émotions dans les langues à ressources limitées

Cette étude améliore les systèmes de reconnaissance des émotions pour les langues moins courantes en utilisant des données à forte ressource.

2025-06-08T07:51:20+00:00 ― 9 min lire

Calcul et langage Évaluation des compétences des LLM en raisonnement narratif

Cette étude évalue comment les LLM comprennent les tropes narratifs dans les résumés de films.

2025-06-07T23:11:54+00:00 ― 5 min lire

Traitement de l'audio et de la parole Évaluer les codecs audio neuronaux : Avis du défi Codec-SUPERB

Un aperçu des résultats du défi Codec-SUPERB et des métriques de performance des codecs.

2025-06-05T06:58:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les modèles de langage sans avoir besoin de beaucoup de données d'entraînement

Une nouvelle méthode pour les modèles de langage parlés réduit le besoin de données massives.

2025-05-29T17:50:26+00:00 ― 8 min lire

Calcul et langage Progrès dans les modèles de langage oral

Découvrez comment Align-SLM change la génération de la parole par ordinateur.

2025-05-25T12:16:30+00:00 ― 7 min lire

Calcul et langage Créer un chatbot pour des conversations en mandarin taïwanais

Créer un modèle d'IA pour des conversations naturelles en mandarin taïwanais.

2025-05-20T03:51:26+00:00 ― 6 min lire

Son Étapes simples pour apprendre une nouvelle langue

Un guide pour apprendre une nouvelle langue efficacement avec des conseils pratiques.

2025-04-21T06:21:36+00:00 ― 6 min lire

Son Avancées dans la reconnaissance automatique de la parole

De nouvelles méthodes améliorent la façon dont les machines reconnaissent le langage parlé.

2025-04-20T10:37:12+00:00 ― 10 min lire

Traitement de l'audio et de la parole Progrès dans la reconnaissance automatique de la parole pour les langues inconnues

De nouvelles méthodes améliorent les systèmes ASR pour des langues qu'ils n'ont jamais rencontrées avant.

2025-02-05T19:53:24+00:00 ― 8 min lire

Calcul et langage Garder les grands modèles de langage sûrs et efficaces

Une nouvelle méthode fusionne des modèles pour améliorer la sécurité et la performance.

2025-01-22T06:45:27+00:00 ― 7 min lire