Haizhou Li

Calcul et langage Détecter l'influence de l'IA dans l'écriture académique

Un nouveau jeu de données aide à identifier les textes retouchés par l'IA dans les résumés académiques.

2025-10-17T10:11:42+00:00 ― 7 min lire

Calcul et langage GrammarGPT : Améliorer la correction des erreurs grammaticales en chinois

Un modèle open-source dédié à corriger les fautes de grammaire en chinois natif.

2025-10-16T03:38:54+00:00 ― 6 min lire

Calcul et langage Présentation du Référentiel Médical Complet pour les LLM en Chine

Une nouvelle référence pour évaluer les modèles linguistiques dans des contextes médicaux chinois.

2025-10-07T18:51:24+00:00 ― 13 min lire

Traitement de l'audio et de la parole Avancées dans les embeddings acoustiques de mots

Un nouveau modèle améliore la façon dont les ordinateurs traitent la langue parlée.

2025-10-07T04:16:50+00:00 ― 5 min lire

Calcul et langage Exploiter des systèmes de recommandation conversationnels holistiques

Un aperçu des recommandations par conversation utilisant un vrai dialogue pour de meilleures suggestions.

2025-09-26T18:12:24+00:00 ― 7 min lire

Intelligence artificielle Avancées dans la technologie de synthèse vocale sensible aux émotions

Le nouveau modèle EmoPP améliore la parole avec des indices émotionnels.

2025-09-24T07:13:12+00:00 ― 6 min lire

Calcul et langage AceGPT : Relier la langue et la culture pour les arabophones

AceGPT améliore le traitement de la langue arabe adapté à la culture et aux valeurs locales.

2025-09-23T18:42:42+00:00 ― 6 min lire

Son Nouveau système améliore l'extraction vocale depuis des positions de tête instables

PIAVE aide les machines à extraire les voix clairement, même quand les intervenants tournent la tête.

2025-09-12T19:39:40+00:00 ― 7 min lire

Son Avancées dans l'édition de discours textuel

FluentEditor améliore le montage audio en se concentrant sur le flow naturel et la cohérence.

2025-09-07T20:37:55+00:00 ― 5 min lire

Informatique neuronale et évolutive Avancées dans l'entraînement des réseaux de neurones à spikes

De nouvelles méthodes d'apprentissage améliorent l'efficacité et la précision des réseaux neuronaux à pics.

2025-09-03T02:03:54+00:00 ― 8 min lire

Traitement de l'audio et de la parole Progrès en traitement multimodal avec CoAVT

CoAVT intègre des données audio, visuelles et textuelles pour une meilleure compréhension.

2025-08-28T12:02:50+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancement de la technologie de détection de locuteur actif

De nouvelles méthodes améliorent la détection des orateurs audio-visuels dans des environnements difficiles.

2025-08-14T01:29:10+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancement de l'extraction de la voix du locuteur dans les médias audio-visuels avec SEANet

SEANet améliore l'isolement des intervenants en réduisant le bruit dans le traitement audio.

2025-08-08T20:47:20+00:00 ― 8 min lire

Calcul et langage Évaluation de la NLG avec le cadre AdvEval

AdvEval met en lumière les faiblesses des métriques d'évaluation de la génération de langage naturel.

2025-08-08T07:29:42+00:00 ― 8 min lire

Calcul et langage Améliorer les systèmes de dialogue grâce à l'apprentissage mutuel

Une nouvelle approche améliore les systèmes de dialogue en combinant les sujets et les structures rhétoriques.

2025-08-04T06:19:30+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la synthèse vocale avec ARDiT

Le nouveau modèle ARDiT améliore la synthèse vocale et l'édition de la parole.

2025-07-31T07:55:45+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de diarisation de la parole ciblée

Un coup d'œil sur les nouvelles méthodes pour comprendre les discours qui se chevauchent pendant les conversations.

2025-07-30T14:06:55+00:00 ― 9 min lire

Traitement de l'audio et de la parole Avancées dans la conversion vocale interlinguale

Une nouvelle méthode améliore la conversion vocale entre les langues tout en préservant les traits du locuteur.

2025-07-27T15:40:10+00:00 ― 5 min lire

Calcul et langage L'importance de la sélection des données dans les modèles de langue

Une revue de comment la sélection des données améliore la performance des modèles linguistiques.

2025-07-26T03:06:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la technologie de reconnaissance faciale et vocale

Un nouveau cadre améliore la connexion entre les visages et les voix, surtout dans des environnements bruyants.

2025-07-10T17:11:20+00:00 ― 6 min lire

Son Avancées dans la localisation des sources sonores avec l'apprentissage incrémental

Une nouvelle méthode améliore la précision de la localisation sonore tout en garantissant la confidentialité des données.

2025-06-14T07:59:10+00:00 ― 5 min lire

Son Avancées dans les techniques de conversion d'accent

Une nouvelle méthode pour générer de la parole accentuée en utilisant la translittération du texte.

2025-06-11T06:18:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole E1 TTS : Une nouvelle ère dans la technologie de synthèse vocale

E1 TTS transforme le texte en parole naturelle plus rapidement et plus efficacement.

2025-06-11T05:29:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Matryoshka Embeddings de Haut-Parleur : Une Approche Flexible pour la Reconnaissance Vocale

Découvrez comment les embeddings Matryoshka améliorent l'efficacité et la flexibilité de la reconnaissance vocale.

2025-06-02T20:40:50+00:00 ― 6 min lire

Son Avancer le traitement multi-audio avec MALLM

Présentation d'un nouveau modèle et d'une référence pour évaluer les tâches multi-audio.

2025-05-31T19:17:15+00:00 ― 7 min lire

Son Utiliser des indices visuels pour clarifier la parole dans le bruit

Une nouvelle méthode améliore la clarté de la parole en utilisant des infos visuelles de l'environnement.

2025-05-18T20:42:14+00:00 ― 6 min lire

Son Apporter des émotions aux machines : l'avenir de la synthèse vocale

Découvre comment le TTS émotionnel change la communication avec les machines, les rendant plus proches.

2025-02-23T02:25:48+00:00 ― 7 min lire