Urhythmic améliore la conversion vocale en se concentrant sur le rythme de la parole.

2025-10-09T21:52:05+00:00 ― 6 min lire

Son Avancées dans la récupération d'infos musicales en temps réel pour guitaristes

La recherche améliore les techniques de fingerstyle percussif pour les guitaristes en utilisant la récupération de son en temps réel.

2025-10-09T15:23:25+00:00 ― 10 min lire

Calcul et langage Avancées dans la classification de l'intention de parole et le remplissage de slots

Cet article explore un nouveau modèle pour l'identification de l'intention de discours et des slots.

2025-10-09T12:09:05+00:00 ― 8 min lire

Son Détecter la vérité dans les voix synthétiques

Avec l'avancée de la technologie de clonage vocal, des méthodes de détection fiables sont super importantes.

2025-10-09T06:29:00+00:00 ― 8 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les personnes âgées

Une étude améliore la reconnaissance vocale pour les personnes âgées, en utilisant des techniques innovantes.

2025-10-09T01:37:30+00:00 ― 7 min lire

Calcul et langage Avancées dans la synthèse vocale avec BASS

BASS améliore le résumé des longs audios en traitant par blocs.

2025-10-08T15:05:55+00:00 ― 6 min lire

Son Risques des attaques discrètes par porte dérobée dans les systèmes de reconnaissance vocale

De nouvelles méthodes représentent des risques de sécurité sérieux pour la technologie de reconnaissance vocale.

2025-10-08T14:17:20+00:00 ― 8 min lire

Traitement de l'audio et de la parole Nouveau jeu de données pour améliorer la reconnaissance vocale en hébreu

ivrit.ai fournit des ressources essentielles pour améliorer la technologie ASR en hébreu.

2025-10-08T05:22:55+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de traduction vocale multilingue

Des techniques innovantes transforment la façon dont on traduit le langage parlé.

2025-10-08T02:57:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'anonymisation des locuteurs

De nouvelles méthodes visent à cacher l'identité des intervenants tout en gardant la clarté de la parole.

2025-10-08T01:20:00+00:00 ― 7 min lire

Son Faire progresser la reconnaissance vocale avec un transducteur temporel sparse

Nouveau modèle améliore la vitesse de reconnaissance vocale et l'utilisation de la mémoire.

2025-10-07T23:42:50+00:00 ― 8 min lire

Son Présentation du jeu de données JAZZVAR pour les variations de piano jazz

Un nouveau jeu de données met en avant les interprétations créatives des pianistes de jazz sur des standards classiques.

2025-10-07T14:48:25+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans la modélisation HRTF pour un son réaliste

De nouvelles méthodes améliorent la représentation sonore en réalité virtuelle et augmentée.

2025-10-07T10:45:30+00:00 ― 9 min lire

Son FlexiAST : Une approche flexible du traitement audio

FlexiAST permet aux modèles de s'adapter efficacement à différentes tailles de patch audio.

2025-10-07T09:56:55+00:00 ― 7 min lire

Apprentissage automatique Avancées dans l'analyse de la parole pour la détection du cancer de la gorge

Des chercheurs utilisent l'apprentissage automatique pour améliorer le diagnostic du cancer de la gorge grâce à l'analyse de la parole.

2025-10-07T06:42:35+00:00 ― 8 min lire

Son Présentation de Polyffusion : Une nouvelle façon de créer des partitions musicales

Polyffusion utilise des techniques visuelles pour générer et contrôler la musique de manière efficace.

2025-10-07T01:51:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la détection de l'Alzheimer grâce à l'analyse de la parole

Des chercheurs utilisent des motifs de discours pour détecter Alzheimer plus tôt et de manière plus efficace.

2025-10-07T00:13:55+00:00 ― 7 min lire

Son Nouveau cadre améliore la reconnaissance vocale avec des métadonnées

Intégrer des métadonnées améliore les performances dans des tâches de parole comme l'identification de langue.

2025-10-06T12:05:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les modèles de transducteurs pour la reconnaissance vocale

Cet article parle des capacités en temps réel du modèle Transducer et des améliorations récentes.

2025-10-06T11:16:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Biais dans le transfert d'apprentissage pour la reconnaissance musicale

Cette étude explore le biais dans les modèles audio utilisés pour la reconnaissance d'instruments.

2025-10-06T09:39:25+00:00 ― 8 min lire

Son Avancées dans la classification des genres musicaux avec l'apprentissage profond

Cette étude explore une approche d'apprentissage profond pour classifier avec précision les genres musicaux.

2025-10-06T08:50:50+00:00 ― 8 min lire

Son Localisation automatique des sources sonores en eaux peu profondes

Une nouvelle méthode améliore le suivi de la localisation des sources sonores dans les environnements aquatiques peu profonds.

2025-10-05T13:27:48+00:00 ― 9 min lire

Son Faire avancer la technologie de la parole avec SCRAPS

Un nouveau modèle relie la phonétique et l'acoustique pour améliorer la technologie de la parole.

2025-10-05T13:24:50+00:00 ― 9 min lire

Son Avancées dans la reconnaissance des émotions avec l'apprentissage auto-supervisé

Cette étude met en avant le rôle de l'apprentissage auto-supervisé pour détecter les émotions à partir de données audio.

2025-10-05T08:33:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Rendre la musique facile pour tout le monde

Une nouvelle interface simplifie la création musicale pour les débutants grâce à la technologie de texte à audio.

2025-10-04T18:47:25+00:00 ― 6 min lire

Son Évaluation des prothèses auditives et de l'amélioration de la parole par IA

Des recherches montrent les améliorations que l'IA peut apporter aux appareils auditifs dans des environnements bruyants.

2025-10-04T17:58:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la séparation des sources musicales avec des données bruyantes

Une nouvelle méthode affine les données mal étiquetées, améliorant la séparation des sources musicales.

2025-10-04T10:41:35+00:00 ― 9 min lire

Son Nouvelles méthodes pour décoder l'attention auditive

Des avancées dans la compréhension de comment les gens se concentrent sur les sons à partir de l'activité cérébrale.

2025-10-04T07:43:21+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de synthèse de champ sonore

Une nouvelle méthode améliore la clarté et la localisation du son en utilisant une approche hybride.

2025-10-04T07:27:15+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'annulation d'écho acoustique avec CMNet

CMNet améliore la clarté vocale en réduisant l'écho dans les appareils de communication.

2025-10-04T06:38:40+00:00 ― 6 min lire

Son Améliorer la reconnaissance de cibles sous-marines avec des réseaux neuronaux

Une nouvelle méthode améliore la classification des sons sous-marins des navires en utilisant des réseaux de neurones.

2025-10-04T05:01:30+00:00 ― 6 min lire

Son Avancées dans la technologie des aides auditives

La recherche vise à améliorer la clarté des aides auditives pour une meilleure communication.

2025-10-04T02:35:45+00:00 ― 7 min lire

Son Avancées dans l'amélioration de la parole grâce aux réseaux de neurones à pics

Une nouvelle méthode pour améliorer la qualité de la parole en utilisant des réseaux éconergétiques.

2025-10-03T21:44:15+00:00 ― 6 min lire

Son Comprendre les vocalisations des vaches pendant le stress

Des recherches mettent en avant la communication des vaches pour améliorer les pratiques de l'élevage laitier.

2025-10-03T15:15:35+00:00 ― 6 min lire

Son Présentation de MuReNN : Un nouveau modèle pour le traitement audio

MuReNN combine des modèles paramétriques et non paramétriques pour une meilleure analyse audio.

2025-10-03T14:14:43+00:00 ― 6 min lire

Apprentissage automatique BioLingual : Une nouvelle ère en bioacoustique

Révolutionner la recherche sur la communication animale avec une intégration innovante de l'audio et du langage.

2025-10-03T11:32:00+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'amélioration de la parole avec PCNN

Présentation d'un nouveau modèle pour parler plus clairement dans les environnements bruyants.

2025-10-03T07:58:20+00:00 ― 6 min lire

Multimédia Avancées dans le Matching Visuel Acoustique

Une nouvelle méthode améliore l'appariement audio en utilisant des images, rendant les environnements audio plus réalistes.

2025-10-03T03:55:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'amélioration de la voix

Améliorer la qualité de la parole grâce à des méthodes innovantes et des jeux de données multilingues.

2025-10-02T23:52:30+00:00 ― 8 min lire

Son Détection efficace des deepfakes audio

De nouveaux systèmes sont conçus pour détecter les enregistrements audio truqués avec une précision améliorée.

2025-10-02T18:12:25+00:00 ― 7 min lire

Informatique - Son