Une nouvelle méthode améliore la reconnaissance vocale pour les locuteurs arabes atteints de dysarthrie.

2025-10-26T07:23:35+00:00 ― 7 min lire

Calcul et langage Outil de Reconnaissance Vocale Innovant pour Langues à Faibles Ressources

Allophant améliore la reconnaissance des phonèmes pour les langues avec peu de données.

2025-10-26T06:35:00+00:00 ― 7 min lire

Son SANGEET : Un ensemble de données structuré pour la musique hindoustani

Présentation de SANGEET, un jeu de données complet sur la musique classique hindoustanie.

2025-10-26T04:57:50+00:00 ― 5 min lire

Son S'attaquer au défi de la détection des faux audios

Une nouvelle méthode vise à améliorer la détection des faux audios sans perdre les connaissances passées.

2025-10-25T16:00:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale non supervisée

Un nouveau cadre améliore l'étude des systèmes de reconnaissance vocale non supervisée.

2025-10-25T13:34:45+00:00 ― 9 min lire

Son Créer des mélodies à partir de rythmes simples

Ce projet aide tout le monde à composer de la musique en utilisant des rythmes de base et des méthodes informatiques avancées.

2025-10-25T11:57:35+00:00 ― 6 min lire

Calcul et langage Avancées dans l'apprentissage auto-supervisé pour la reconnaissance vocale

Les modèles auto-supervisés révèlent des trucs sur les distinctions phonétiques et phonémiques dans la parole.

2025-10-25T10:20:25+00:00 ― 7 min lire

Calcul et langage Améliorer la responsabilité de la police avec la technologie de reconnaissance vocale

Des recherches examinent l'utilisation de la reconnaissance vocale dans l'analyse des vidéos de caméras corporelles de police.

2025-10-25T07:54:40+00:00 ― 8 min lire

Son Nouvelles manières dont les ordis créent de la musique

Un regard sur comment les ordinateurs changent la composition musicale.

2025-10-25T04:31:16+00:00 ― 5 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance et la synthèse émotionnelle dans les modèles de parole

De nouvelles techniques améliorent la compréhension émotionnelle dans les tâches de traitement de la parole.

2025-10-25T01:26:00+00:00 ― 8 min lire

Son LinDiff : Un grand pas en avant dans la synthèse vocale

Le nouveau modèle LinDiff améliore la vitesse et la qualité de la synthèse vocale.

2025-10-25T00:37:25+00:00 ― 6 min lire

Son Une nouvelle méthode transforme la technologie de compression audio

Une nouvelle méthode de compression audio réduit la taille des fichiers sans perdre en qualité.

2025-10-24T18:57:20+00:00 ― 7 min lire

Son Améliorer la clarté de la parole dans des environnements bruyants

Techniques pour améliorer la reconnaissance vocale en présence de bruit de fond.

2025-10-24T16:50:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole HiddenSinger : Une nouvelle ère dans la synthèse vocale chantée

HiddenSinger améliore la qualité de la voix de chant grâce à des techniques d'IA avancées.

2025-10-24T14:54:25+00:00 ― 7 min lire

Son Avancées dans la technologie de conversion de voix électrolaryngée

De nouvelles méthodes améliorent la clarté de la parole pour les utilisateurs d'électrolarynx.

2025-10-24T13:17:15+00:00 ― 8 min lire

Son Avancées innovantes dans la technologie de la parole électrolaryngée

Des chercheurs mélangent des caractéristiques visuelles et sonores pour améliorer la parole des utilisateurs d'électrolarynx.

2025-10-24T12:28:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole L'impact de l'âge sur les systèmes de reconnaissance vocale

Une étude montre comment le vieillissement impacte la performance de la vérification automatique des locuteurs.

2025-10-24T10:02:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole PauseSpeech : Avancer la technologie de synthèse vocale

PauseSpeech améliore les systèmes TTS avec une voix qui sonne plus naturelle grâce à des pauses mieux gérées.

2025-10-24T09:14:20+00:00 ― 6 min lire

Multimédia Un nouveau système pour associer musique et vidéo

Cette recherche présente un système pour associer de la musique avec du contenu vidéo de manière efficace.

2025-10-24T07:37:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale dans des environnements bruyants

De nouvelles méthodes améliorent la performance de la reconnaissance vocale automatique en milieu bruyant.

2025-10-24T02:45:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Gestion efficace des grands modèles de parole

Une nouvelle méthode optimise les modèles de parole pour de meilleures performances avec moins de ressources.

2025-10-23T21:54:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Nouvelle méthode pour l'évaluation objective de l'audio spatial

Une nouvelle approche améliore notre façon d'évaluer la qualité audio spatiale.

2025-10-23T19:28:25+00:00 ― 6 min lire

Son Identifier la parole lue vs. la parole spontanée dans les interviews

Une étude sur comment distinguer la parole lue et la parole spontanée.

2025-10-23T18:39:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole StyleTTS 2 : Faire avancer la technologie de synthèse vocale

Un nouveau modèle améliore le réalisme de la parole synthétique.

2025-10-23T15:25:30+00:00 ― 10 min lire

Traitement de l'audio et de la parole Avancées dans le suivi de sources sonores avec PI-RNN

Un nouveau modèle améliore la précision et l'efficacité dans le suivi des sources sonores.

2025-10-23T10:34:00+00:00 ― 6 min lire

Calcul et langage Présentation du dataset ITALIC pour l'italien parlé

Un nouveau jeu de données améliore la compréhension du langage parlé en italien.

2025-10-23T08:56:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les modèles ASR bilingues et à code-switching

De nouvelles méthodes améliorent la reconnaissance vocale multilingue en utilisant des sources de données existantes.

2025-10-23T04:05:20+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les langues à faibles ressources

La recherche se concentre sur l'amélioration de la technologie vocale pour les langues qui manquent de données suffisantes.

2025-10-22T23:13:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'amélioration de la parole

Un aperçu des développements récents pour améliorer la clarté audio avec des modèles avancés.

2025-10-22T21:36:40+00:00 ― 6 min lire

Son Évaluer la difficulté des pièces de piano avec un nouveau dataset

Un nouveau jeu de données vise à classer les partitions de piano par niveau de difficulté.

2025-10-22T20:48:05+00:00 ― 9 min lire

Son Améliorations dans la qualité de la parole

Le cadre Gesper améliore la clarté de la parole dans des environnements bruyants.

2025-10-22T19:59:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer l'amélioration de la parole avec des techniques de normalisation

Cette étude présente une nouvelle méthode pour améliorer la qualité de la parole en utilisant des modèles pré-entraînés.

2025-10-22T19:10:55+00:00 ― 8 min lire

Intelligence artificielle Améliorer la détection de discours haineux dans les multimédias

Combiner audio, vidéo et texte rend la détection des discours de haine plus efficace.

2025-10-22T15:08:00+00:00 ― 7 min lire

Son Une approche simplifiée du HMM hybride pour la reconnaissance vocale

Cet article parle d'une nouvelle méthode pour construire des systèmes ASR efficaces.

2025-10-22T14:19:25+00:00 ― 6 min lire

Son Approche innovante pour l'analyse des chiffres romains en musique

Une nouvelle méthode utilisant des réseaux de neurones graphiques améliore l'analyse des chiffres romains pour la musique.

2025-10-22T13:26:06+00:00 ― 7 min lire

Son Progrès dans la détection d'événements bioacoustiques à quelques exemples

Des équipes améliorent l'identification des sons d'animaux avec quelques exemples dans le défi DCASE.

2025-10-22T07:50:45+00:00 ― 7 min lire

Son Exploiter le tagging audio sur des petits ordis

Découvre les systèmes de taggage audio et comment les utiliser sur Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 6 min lire

Son Avancées dans les algorithmes d'identification des reprises musicales

De nouvelles techniques améliorent la précision et l'efficacité pour identifier les reprises.

2025-10-22T05:25:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de contrôle actif du bruit

Une nouvelle méthode améliore le contrôle du bruit dans les espaces en 3D.

2025-10-22T01:22:05+00:00 ― 6 min lire

Son Évaluer la qualité de la parole avec des modèles d'apprentissage automatique

Cette étude évalue différents modèles pour prédire la qualité de la parole synthétisée.

2025-10-21T16:27:40+00:00 ― 7 min lire

Informatique - Son