Génie électrique et science des systèmes - Traitement de l'audio et de la parole

Traitement de l'audio et de la parole Avancées en bioacoustique grâce aux embeddings de caractéristiques

Cette étude améliore le suivi de la faune en utilisant des embeddings audio pour une meilleure classification des sons.

2025-10-10T02:43:35+00:00 ― 11 min lire

Traitement de l'audio et de la parole Avancées dans la conversion vocale avec la technologie Urhythmic

Urhythmic améliore la conversion vocale en se concentrant sur le rythme de la parole.

2025-10-09T21:52:05+00:00 ― 6 min lire

Son Avancées dans la récupération d'infos musicales en temps réel pour guitaristes

La recherche améliore les techniques de fingerstyle percussif pour les guitaristes en utilisant la récupération de son en temps réel.

2025-10-09T15:23:25+00:00 ― 10 min lire

Calcul et langage Avancées dans la classification de l'intention de parole et le remplissage de slots

Cet article explore un nouveau modèle pour l'identification de l'intention de discours et des slots.

2025-10-09T12:09:05+00:00 ― 8 min lire

Son Détecter la vérité dans les voix synthétiques

Avec l'avancée de la technologie de clonage vocal, des méthodes de détection fiables sont super importantes.

2025-10-09T06:29:00+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale sans texte

Une nouvelle méthode améliore la reconnaissance vocale en utilisant seulement des données audio brutes.

2025-10-09T02:26:05+00:00 ― 7 min lire

Calcul et langage Améliorer la reconnaissance vocale pour les personnes âgées

Une étude améliore la reconnaissance vocale pour les personnes âgées, en utilisant des techniques innovantes.

2025-10-09T01:37:30+00:00 ― 7 min lire

Calcul et langage Avancées dans la synthèse vocale avec BASS

BASS améliore le résumé des longs audios en traitant par blocs.

2025-10-08T15:05:55+00:00 ― 6 min lire

Son Risques des attaques discrètes par porte dérobée dans les systèmes de reconnaissance vocale

De nouvelles méthodes représentent des risques de sécurité sérieux pour la technologie de reconnaissance vocale.

2025-10-08T14:17:20+00:00 ― 8 min lire

Traitement de l'audio et de la parole Nouveau jeu de données pour améliorer la reconnaissance vocale en hébreu

ivrit.ai fournit des ressources essentielles pour améliorer la technologie ASR en hébreu.

2025-10-08T05:22:55+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de traduction vocale multilingue

Des techniques innovantes transforment la façon dont on traduit le langage parlé.

2025-10-08T02:57:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les techniques d'anonymisation des locuteurs

De nouvelles méthodes visent à cacher l'identité des intervenants tout en gardant la clarté de la parole.

2025-10-08T01:20:00+00:00 ― 7 min lire

Son Faire progresser la reconnaissance vocale avec un transducteur temporel sparse

Nouveau modèle améliore la vitesse de reconnaissance vocale et l'utilisation de la mémoire.

2025-10-07T23:42:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la technologie de reconnaissance vocale sensible au domaine

De nouvelles méthodes améliorent la reconnaissance vocale dans des domaines spécifiques sans avoir besoin de beaucoup de données.

2025-10-07T15:37:00+00:00 ― 8 min lire

Son Présentation du jeu de données JAZZVAR pour les variations de piano jazz

Un nouveau jeu de données met en avant les interprétations créatives des pianistes de jazz sur des standards classiques.

2025-10-07T14:48:25+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans la modélisation HRTF pour un son réaliste

De nouvelles méthodes améliorent la représentation sonore en réalité virtuelle et augmentée.

2025-10-07T10:45:30+00:00 ― 9 min lire

Son FlexiAST : Une approche flexible du traitement audio

FlexiAST permet aux modèles de s'adapter efficacement à différentes tailles de patch audio.

2025-10-07T09:56:55+00:00 ― 7 min lire

Apprentissage automatique Avancées dans l'analyse de la parole pour la détection du cancer de la gorge

Des chercheurs utilisent l'apprentissage automatique pour améliorer le diagnostic du cancer de la gorge grâce à l'analyse de la parole.

2025-10-07T06:42:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les embeddings acoustiques de mots

Un nouveau modèle améliore la façon dont les ordinateurs traitent la langue parlée.

2025-10-07T04:16:50+00:00 ― 5 min lire

Son Présentation de Polyffusion : Une nouvelle façon de créer des partitions musicales

Polyffusion utilise des techniques visuelles pour générer et contrôler la musique de manière efficace.

2025-10-07T01:51:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la détection de l'Alzheimer grâce à l'analyse de la parole

Des chercheurs utilisent des motifs de discours pour détecter Alzheimer plus tôt et de manière plus efficace.

2025-10-07T00:13:55+00:00 ― 7 min lire

Son Nouveau cadre améliore la reconnaissance vocale avec des métadonnées

Intégrer des métadonnées améliore les performances dans des tâches de parole comme l'identification de langue.

2025-10-06T12:05:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans les modèles de transducteurs pour la reconnaissance vocale

Cet article parle des capacités en temps réel du modèle Transducer et des améliorations récentes.

2025-10-06T11:16:35+00:00 ― 8 min lire

Traitement de l'audio et de la parole Biais dans le transfert d'apprentissage pour la reconnaissance musicale

Cette étude explore le biais dans les modèles audio utilisés pour la reconnaissance d'instruments.

2025-10-06T09:39:25+00:00 ― 8 min lire

Son Avancées dans la classification des genres musicaux avec l'apprentissage profond

Cette étude explore une approche d'apprentissage profond pour classifier avec précision les genres musicaux.

2025-10-06T08:50:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans l'identification de sujets à partir de données audio

La recherche explore des méthodes pour identifier des sujets directement à partir d'enregistrements audio.

2025-10-05T23:56:25+00:00 ― 6 min lire

Son Localisation automatique des sources sonores en eaux peu profondes

Une nouvelle méthode améliore le suivi de la localisation des sources sonores dans les environnements aquatiques peu profonds.

2025-10-05T13:27:48+00:00 ― 9 min lire

Son Faire avancer la technologie de la parole avec SCRAPS

Un nouveau modèle relie la phonétique et l'acoustique pour améliorer la technologie de la parole.

2025-10-05T13:24:50+00:00 ― 9 min lire

Son Avancées dans la reconnaissance des émotions avec l'apprentissage auto-supervisé

Cette étude met en avant le rôle de l'apprentissage auto-supervisé pour détecter les émotions à partir de données audio.

2025-10-05T08:33:20+00:00 ― 7 min lire

Traitement de l'audio et de la parole Rendre la musique facile pour tout le monde

Une nouvelle interface simplifie la création musicale pour les débutants grâce à la technologie de texte à audio.

2025-10-04T18:47:25+00:00 ― 6 min lire

Son Évaluation des prothèses auditives et de l'amélioration de la parole par IA

Des recherches montrent les améliorations que l'IA peut apporter aux appareils auditifs dans des environnements bruyants.

2025-10-04T17:58:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la séparation des sources musicales avec des données bruyantes

Une nouvelle méthode affine les données mal étiquetées, améliorant la séparation des sources musicales.

2025-10-04T10:41:35+00:00 ― 9 min lire

Son Nouvelles méthodes pour décoder l'attention auditive

Des avancées dans la compréhension de comment les gens se concentrent sur les sons à partir de l'activité cérébrale.

2025-10-04T07:43:21+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans les techniques de synthèse de champ sonore

Une nouvelle méthode améliore la clarté et la localisation du son en utilisant une approche hybride.

2025-10-04T07:27:15+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans l'annulation d'écho acoustique avec CMNet

CMNet améliore la clarté vocale en réduisant l'écho dans les appareils de communication.

2025-10-04T06:38:40+00:00 ― 6 min lire

Son Améliorer la reconnaissance de cibles sous-marines avec des réseaux neuronaux

Une nouvelle méthode améliore la classification des sons sous-marins des navires en utilisant des réseaux de neurones.

2025-10-04T05:01:30+00:00 ― 6 min lire

Son Avancées dans la technologie des aides auditives

La recherche vise à améliorer la clarté des aides auditives pour une meilleure communication.

2025-10-04T02:35:45+00:00 ― 7 min lire

Son Avancées dans l'amélioration de la parole grâce aux réseaux de neurones à pics

Une nouvelle méthode pour améliorer la qualité de la parole en utilisant des réseaux éconergétiques.

2025-10-03T21:44:15+00:00 ― 6 min lire

Son Comprendre les vocalisations des vaches pendant le stress

Des recherches mettent en avant la communication des vaches pour améliorer les pratiques de l'élevage laitier.

2025-10-03T15:15:35+00:00 ― 6 min lire

Son Présentation de MuReNN : Un nouveau modèle pour le traitement audio

MuReNN combine des modèles paramétriques et non paramétriques pour une meilleure analyse audio.

2025-10-03T14:14:43+00:00 ― 6 min lire