Informatique - Son

Son Avancées dans le suivi de la santé basé sur la voix

De nouvelles méthodes utilisant la parole montrent des promesses pour identifier les schémas de respiration et les problèmes de santé.

2025-11-06T10:36:05+00:00 ― 6 min lire

Son MIDI-Draw : Une nouvelle façon de créer des mélodies

MIDI-Draw permet à tout le monde de créer de la musique en dessinant des mélodies de manière intuitive.

2025-11-06T09:47:30+00:00 ― 6 min lire

Son Méthodes innovantes pour évaluer la qualité audio

De nouvelles techniques inspirées du traitement d'images améliorent l'évaluation de la qualité audio.

2025-11-06T08:58:55+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans le traitement de la parole avec des données visuelles

De nouvelles méthodes améliorent la compréhension de la parole par les machines en utilisant des indices audio et visuels.

2025-11-06T07:21:45+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la détection de mots-clés dans des environnements bruyants

Nouveau modèle améliore la reconnaissance des mots-clés dans des environnements acoustiques difficiles.

2025-11-06T04:07:25+00:00 ― 8 min lire

Calcul et langage Améliorer la compréhension de la parole avec la distillation des connaissances

Une nouvelle méthode améliore les modèles de parole en transférant des connaissances des modèles de texte.

2025-11-06T01:41:40+00:00 ― 7 min lire

Traitement de l'audio et de la parole Dataset Coswara : Outil innovant pour la détection du COVID-19

Une collection de sons respiratoires aide à identifier les cas de COVID-19.

2025-11-06T00:12:57+00:00 ― 5 min lire

Son ACA-Net : Avancement des systèmes de vérification des locuteurs

Un nouveau modèle améliore la vérification des locuteurs grâce à des techniques efficaces.

2025-11-05T23:15:55+00:00 ― 7 min lire

Son Avancées dans les systèmes de reconnaissance vocale pour le défi VoxCeleb

Un aperçu détaillé des techniques de reconnaissance vocale développées pour la compétition de 2022.

2025-11-05T21:38:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la compréhension de la parole et des émotions par l'IA

Une nouvelle méthode forme l'IA à mieux reconnaître la parole et les émotions dans des environnements bruyants.

2025-11-05T17:35:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Analyse audio innovante pour l'interaction familiale

De nouvelles méthodes visent à mieux comprendre la dynamique familiale et la santé mentale des enfants.

2025-11-05T16:47:15+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les systèmes de protection des enceintes

De nouvelles méthodes d'apprentissage profond améliorent les prédictions des mouvements du diaphragme des locuteurs.

2025-11-05T16:10:24+00:00 ― 6 min lire

Calcul et langage Exploiter ciwGAN pour l'analyse phonologique

Explorer comment ciwGAN peut apprendre et représenter des caractéristiques phonologiques comme la nasalité.

2025-11-05T15:10:05+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale avec MH-SSM

Un nouveau modèle améliore l'efficacité et la précision de la reconnaissance vocale.

2025-11-05T14:21:30+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec un aperçu contextuel

Une nouvelle méthode améliore la précision de la reconnaissance vocale en utilisant des infos contextuelles.

2025-11-05T13:32:55+00:00 ― 7 min lire

Son Simuler une parole bruyante pour une meilleure reconnaissance

Les chercheurs utilisent des GANs pour générer de la parole bruitée à partir d'audio propre, améliorant les modèles de parole.

2025-11-05T12:44:20+00:00 ― 7 min lire

Son Présentation du Corpus JNV : Une nouvelle collection de vocalisations non verbales japonaises

Le corpus JNV capture des sons émotionnels variés en japonais, enrichissant les collections existantes.

2025-11-05T11:55:45+00:00 ― 7 min lire

Son Avancées dans la synthèse de rires réalistes

De nouvelles méthodes améliorent la génération de rires pour des interactions réalistes entre humains et ordinateurs.

2025-11-05T11:07:10+00:00 ― 6 min lire

Son Détecter la parole synthétique : défis et solutions

Un coup d'œil sur comment repérer les faux audios dans notre monde technologique d'aujourd'hui.

2025-11-05T10:18:35+00:00 ― 6 min lire

Son Avancées dans la reconnaissance des émotions vocales avec LGFA

Une nouvelle méthode améliore la détection des émotions dans la parole grâce à des techniques avancées de transformateurs.

2025-11-05T10:09:24+00:00 ― 6 min lire

Calcul et langage Faire avancer les modèles de discours grâce à la connaissance textuelle

Utiliser des modèles de texte pour améliorer la génération de discours pour une meilleure compréhension.

2025-11-05T09:30:00+00:00 ― 11 min lire

Apprentissage automatique Avancer l'apprentissage multimodal avec le C-MCR

C-MCR simplifie l'apprentissage multi-modal en reliant efficacement les connaissances existantes.

2025-11-05T03:49:55+00:00 ― 8 min lire

Son FluentSpeech : Une nouvelle approche pour éliminer le bégaiement

FluentSpeech propose une solution automatique pour rendre l'édition de la parole plus fluide.

2025-11-05T02:12:45+00:00 ― 8 min lire

Traitement de l'audio et de la parole Adaptation de Domaine Modulaire : Une Nouvelle Approche pour la Reconnaissance Vocale

MDA améliore la reconnaissance vocale en optimisant les modèles pour des domaines de données spécifiques.

2025-11-05T01:24:10+00:00 ― 7 min lire

Physique médicale Une nouvelle étude relie les signaux du cerveau aux mouvements de la langue

Des recherches montrent que les signaux cérébraux peuvent aider à prédire les mouvements de la langue pendant la parole.

2025-11-04T23:54:21+00:00 ― 8 min lire

Son Avancées dans la technologie de synthèse vocale avec U-DiT

Le système U-DiT TTS améliore la génération de la parole naturelle grâce à une architecture innovante.

2025-11-04T23:47:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour tous les intervenants

Une nouvelle méthode vise à améliorer les systèmes de reconnaissance vocale pour les locuteurs dysarthriques.

2025-11-04T22:58:25+00:00 ― 7 min lire

Calcul et langage Amélioration de la diarisation des locuteurs grâce à l'analyse des mots

Améliorer l'identification des locuteurs en combinant le son et les mots prononcés dans l'audio.

2025-11-04T18:55:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Adapter des gestes pour les agents virtuels

Les agents virtuels apprennent à imiter les gestes humains pour une meilleure interaction.

2025-11-04T18:06:55+00:00 ― 8 min lire

Son Simplifier la synthèse sonore avec NAS-FM

Une nouvelle méthode pour créer des synthétiseurs qui profite aux musiciens.

2025-11-04T17:18:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de détection de locuteur actif

Un nouveau cadre améliore la détection du locuteur actif en utilisant des indices audio et visuels.

2025-11-04T16:29:45+00:00 ― 7 min lire

Son Renforcer la vérification vocale contre les menaces avancées

Un aperçu des défis et des défenses dans les systèmes de vérification automatique des locuteurs.

2025-11-04T15:41:10+00:00 ― 6 min lire

Son Le Rôle des Réseaux Optiques dans la Communication Moderne

Les réseaux optiques permettent un transfert de données rapide, façonnant l'avenir de la technologie de communication.

2025-11-04T14:04:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer les modèles audio généraux pour les tâches de parole

Une nouvelle méthode améliore les modèles audio généraux pour une reconnaissance vocale efficace.

2025-11-04T05:58:10+00:00 ― 9 min lire

Calcul et langage Avancées dans la reconnaissance des émotions dans les conversations

Nouveau modèle améliore la compréhension émotionnelle dans les dialogues.

2025-11-04T05:09:35+00:00 ― 8 min lire

Calcul et langage Nouveau modèle améliore la qualité de traduction vocale

Un modèle combine langue parlée et texte pour améliorer la précision de la traduction.

2025-11-04T04:21:00+00:00 ― 7 min lire

Apprentissage automatique Étudier les appels des marmousets à travers des modèles de parole humaine

La recherche utilise des modèles de parole humaine pour analyser efficacement les vocalises des Marmosets.

2025-11-04T03:32:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'analyse des sons pulmonaires

De nouvelles méthodes améliorent la détection précoce des maladies respiratoires en utilisant des données sonores.

2025-11-04T02:43:50+00:00 ― 7 min lire

Son Faire la différence entre le rire heureux et le rire moqueur

Cette étude examine comment le rire transmet des émotions à travers l'analyse sonore.

2025-11-04T01:55:15+00:00 ― 5 min lire

Traitement de l'audio et de la parole EfficientSpeech : Technologie de synthèse vocale sur appareil

Un nouveau modèle apporte des fonctionnalités vocales aux appareils sans internet.

2025-11-04T01:06:40+00:00 ― 6 min lire