Les modèles auto-supervisés révèlent des trucs sur les distinctions phonétiques et phonémiques dans la parole.

2025-10-25T10:20:25+00:00 ― 7 min lire

Calcul et langage Améliorer la responsabilité de la police avec la technologie de reconnaissance vocale

Des recherches examinent l'utilisation de la reconnaissance vocale dans l'analyse des vidéos de caméras corporelles de police.

2025-10-25T07:54:40+00:00 ― 8 min lire

Son Nouvelles manières dont les ordis créent de la musique

Un regard sur comment les ordinateurs changent la composition musicale.

2025-10-25T04:31:16+00:00 ― 5 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance et la synthèse émotionnelle dans les modèles de parole

De nouvelles techniques améliorent la compréhension émotionnelle dans les tâches de traitement de la parole.

2025-10-25T01:26:00+00:00 ― 8 min lire

Son LinDiff : Un grand pas en avant dans la synthèse vocale

Le nouveau modèle LinDiff améliore la vitesse et la qualité de la synthèse vocale.

2025-10-25T00:37:25+00:00 ― 6 min lire

Son Une nouvelle méthode transforme la technologie de compression audio

Une nouvelle méthode de compression audio réduit la taille des fichiers sans perdre en qualité.

2025-10-24T18:57:20+00:00 ― 7 min lire

Son Améliorer la clarté de la parole dans des environnements bruyants

Techniques pour améliorer la reconnaissance vocale en présence de bruit de fond.

2025-10-24T16:50:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole HiddenSinger : Une nouvelle ère dans la synthèse vocale chantée

HiddenSinger améliore la qualité de la voix de chant grâce à des techniques d'IA avancées.

2025-10-24T14:54:25+00:00 ― 7 min lire

Son Avancées dans la technologie de conversion de voix électrolaryngée

De nouvelles méthodes améliorent la clarté de la parole pour les utilisateurs d'électrolarynx.

2025-10-24T13:17:15+00:00 ― 8 min lire

Son Avancées innovantes dans la technologie de la parole électrolaryngée

Des chercheurs mélangent des caractéristiques visuelles et sonores pour améliorer la parole des utilisateurs d'électrolarynx.

2025-10-24T12:28:40+00:00 ― 6 min lire

Traitement de l'audio et de la parole L'impact de l'âge sur les systèmes de reconnaissance vocale

Une étude montre comment le vieillissement impacte la performance de la vérification automatique des locuteurs.

2025-10-24T10:02:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole PauseSpeech : Avancer la technologie de synthèse vocale

PauseSpeech améliore les systèmes TTS avec une voix qui sonne plus naturelle grâce à des pauses mieux gérées.

2025-10-24T09:14:20+00:00 ― 6 min lire

Multimédia Un nouveau système pour associer musique et vidéo

Cette recherche présente un système pour associer de la musique avec du contenu vidéo de manière efficace.

2025-10-24T07:37:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale dans des environnements bruyants

De nouvelles méthodes améliorent la performance de la reconnaissance vocale automatique en milieu bruyant.

2025-10-24T02:45:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Gestion efficace des grands modèles de parole

Une nouvelle méthode optimise les modèles de parole pour de meilleures performances avec moins de ressources.

2025-10-23T21:54:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Nouvelle méthode pour l'évaluation objective de l'audio spatial

Une nouvelle approche améliore notre façon d'évaluer la qualité audio spatiale.

2025-10-23T19:28:25+00:00 ― 6 min lire

Son Identifier la parole lue vs. la parole spontanée dans les interviews

Une étude sur comment distinguer la parole lue et la parole spontanée.

2025-10-23T18:39:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole StyleTTS 2 : Faire avancer la technologie de synthèse vocale

Un nouveau modèle améliore le réalisme de la parole synthétique.

2025-10-23T15:25:30+00:00 ― 10 min lire

Traitement de l'audio et de la parole Avancées dans le suivi de sources sonores avec PI-RNN

Un nouveau modèle améliore la précision et l'efficacité dans le suivi des sources sonores.

2025-10-23T10:34:00+00:00 ― 6 min lire

Calcul et langage Présentation du dataset ITALIC pour l'italien parlé

Un nouveau jeu de données améliore la compréhension du langage parlé en italien.

2025-10-23T08:56:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les modèles ASR bilingues et à code-switching

De nouvelles méthodes améliorent la reconnaissance vocale multilingue en utilisant des sources de données existantes.

2025-10-23T04:05:20+00:00 ― 9 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les langues à faibles ressources

La recherche se concentre sur l'amélioration de la technologie vocale pour les langues qui manquent de données suffisantes.

2025-10-22T23:13:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'amélioration de la parole

Un aperçu des développements récents pour améliorer la clarté audio avec des modèles avancés.

2025-10-22T21:36:40+00:00 ― 6 min lire

Son Évaluer la difficulté des pièces de piano avec un nouveau dataset

Un nouveau jeu de données vise à classer les partitions de piano par niveau de difficulté.

2025-10-22T20:48:05+00:00 ― 9 min lire

Son Améliorations dans la qualité de la parole

Le cadre Gesper améliore la clarté de la parole dans des environnements bruyants.

2025-10-22T19:59:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer l'amélioration de la parole avec des techniques de normalisation

Cette étude présente une nouvelle méthode pour améliorer la qualité de la parole en utilisant des modèles pré-entraînés.

2025-10-22T19:10:55+00:00 ― 8 min lire

Intelligence artificielle Améliorer la détection de discours haineux dans les multimédias

Combiner audio, vidéo et texte rend la détection des discours de haine plus efficace.

2025-10-22T15:08:00+00:00 ― 7 min lire

Son Une approche simplifiée du HMM hybride pour la reconnaissance vocale

Cet article parle d'une nouvelle méthode pour construire des systèmes ASR efficaces.

2025-10-22T14:19:25+00:00 ― 6 min lire

Son Approche innovante pour l'analyse des chiffres romains en musique

Une nouvelle méthode utilisant des réseaux de neurones graphiques améliore l'analyse des chiffres romains pour la musique.

2025-10-22T13:26:06+00:00 ― 7 min lire

Son Progrès dans la détection d'événements bioacoustiques à quelques exemples

Des équipes améliorent l'identification des sons d'animaux avec quelques exemples dans le défi DCASE.

2025-10-22T07:50:45+00:00 ― 7 min lire

Son Exploiter le tagging audio sur des petits ordis

Découvre les systèmes de taggage audio et comment les utiliser sur Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 6 min lire

Son Avancées dans les algorithmes d'identification des reprises musicales

De nouvelles techniques améliorent la précision et l'efficacité pour identifier les reprises.

2025-10-22T05:25:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de contrôle actif du bruit

Une nouvelle méthode améliore le contrôle du bruit dans les espaces en 3D.

2025-10-22T01:22:05+00:00 ― 6 min lire

Son Évaluer la qualité de la parole avec des modèles d'apprentissage automatique

Cette étude évalue différents modèles pour prédire la qualité de la parole synthétisée.

2025-10-21T16:27:40+00:00 ― 7 min lire

Son Avancées dans les méthodes de classification des sons d'oiseaux

Des chercheurs automatisent la classification des sons d'oiseaux, améliorant la précision dans le suivi des espèces.

2025-10-21T14:50:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole FALL-E : Une nouvelle ère dans la création sonore

FALL-E crée des effets sonores de haute qualité à partir de descriptions textuelles.

2025-10-21T13:13:20+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale multi-parleur avec SURT 2.0

SURT 2.0 améliore la reconnaissance vocale pour plusieurs intervenants en temps réel.

2025-10-21T05:07:30+00:00 ― 7 min lire

Son Présentation de MARBLE : un étalon pour l'IA musicale

MARBLE établit une norme pour évaluer les modèles d'IA musicale sur plusieurs tâches.

2025-10-21T04:18:55+00:00 ― 9 min lire

Traitement de l'audio et de la parole Nouveau modèle améliore la détection des sons des oiseaux

Une nouvelle méthode améliore la précision pour identifier les chants d'oiseaux.

2025-10-21T03:30:20+00:00 ― 7 min lire

Son Améliorer le traitement audio avec des couches SFI

De nouveaux algos améliorent la performance du traitement audio à différents taux d'échantillonnage.

2025-10-21T00:16:00+00:00 ― 7 min lire

Informatique - Son