Informatique - Son

RSS

Son Notochord : un nouvel outil MIDI pour les musiciens

Notochord améliore la création de musique MIDI en temps réel avec l'IA pour des performances plus riches.

2025-08-17T06:24:35+00:00 ― 7 min lire

Derniers articles

Son Prompt-Chanteur : Une nouvelle approche du contrôle de la voix chantée

2025-08-17T01:33:05+00:00 ― 9 min lire

Son Avancées dans la reconnaissance des émotions dans la voix avec emoDARTS

2025-08-16T17:27:15+00:00 ― 8 min lire

Son Avancées dans les caractéristiques de voix de synthèse vocale

2025-08-16T12:35:45+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie d'édition de la parole

2025-08-15T09:03:55+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la technologie d'accompagnement de danse

2025-08-14T21:43:45+00:00 ― 8 min lire

Derniers articles

Traitement de l'audio et de la parole Renaître l'Histoire : L'Art de la Restauration Audio

Découvrez comment l'égalisation générative redonne vie aux vieux enregistrements musicaux.

2025-08-14T20:06:35+00:00 ― 9 min lire

Calcul et langage Classer les sous-dialectes du kurde sorani à travers des données audio

La recherche identifie et classe les dialectes kurdes sorani en utilisant des enregistrements audio extensifs.

2025-08-14T07:57:50+00:00 ― 7 min lire

Traitement de l'audio et de la parole Automatisation de l'ajustement du son pour des acoustiques réalistes

Une nouvelle méthode améliore le traitement du son grâce à l'accord automatique des réseaux de retard de feedback.

2025-08-14T07:09:15+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans l'évaluation automatique de la qualité de la parole

Une nouvelle méthode améliore l'évaluation de la parole en utilisant des enregistrements entiers.

2025-08-14T06:20:40+00:00 ― 10 min lire

Son Mesurer l'Adhérence dans les Modèles de Musique Générative

Une nouvelle méthode pour évaluer à quel point la musique suit les invites audio.

2025-08-13T23:03:25+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Présentation du jeu de données 360+x pour une meilleure compréhension des scènes

Un nouveau jeu de données améliore la façon dont les robots interprètent les environnements réels.

2025-08-13T18:11:55+00:00 ― 9 min lire

Son Nouvelle approche pour la séparation audio en utilisant le langage

Cette méthode améliore la séparation audio en combinant des descriptions de langue avec une analyse sonore.

2025-08-13T14:57:35+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de UniAV : Une approche unifiée de la localisation vidéo

UniAV combine la localisation d'action, la détection de son et la localisation d'événements audio-visuels pour une meilleure compréhension des vidéos.

2025-08-13T10:06:05+00:00 ― 10 min lire

Traitement de l'audio et de la parole CLaM-TTS : Faire avancer la technologie de la synthèse vocale

CLaM-TTS améliore la synthèse vocale en utilisant des techniques avancées pour plus d'efficacité et de qualité.

2025-08-13T08:28:55+00:00 ― 8 min lire

Réseaux sociaux et d'information Analyser la musique à travers des graphiques

Les graphiques permettent d'avoir de nouvelles idées sur la structure de la musique et les relations qui l'entourent.

2025-08-13T03:09:57+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la synthèse vocale avec RALL-E

RALL-E améliore la synthèse texte-parole pour un discours plus clair et naturel.

2025-08-13T01:11:40+00:00 ― 6 min lire

Son Avancées dans la modélisation audio analogique virtuelle

Explorer des techniques d'apprentissage automatique pour modéliser des effets audio analogiques.

2025-08-12T22:37:18+00:00 ― 8 min lire

Son MuPT : Faire avancer la génération de musique avec la notation ABC

MuPT utilise la notation ABC pour une génération musicale efficace avec l'IA.

2025-08-12T09:00:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Faire avancer l'apprentissage audio avec M2D et M2D-X

De nouvelles méthodes améliorent la représentation audio grâce à des techniques d'apprentissage auto-supervisé.

2025-08-12T07:22:50+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconstruction du champ sonore avec l'IA

Une méthode utilisant l'IA améliore la représentation sonore dans différents environnements.

2025-08-12T00:54:10+00:00 ― 8 min lire

Physique classique Comprendre les moments spectraux dans les tests électromagnétiques

Explore le rôle des moments spectraux dans les tests en chambre de réverbération et l'impact du bruit.

2025-08-12T00:28:33+00:00 ― 7 min lire

Traitement de l'audio et de la parole Modèle de transcription piano en temps réel efficace

Un nouveau système pour une transcription de piano en temps réel, précise et légère.

2025-08-12T00:05:35+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Any2Point : Connecter la compréhension 3D dans les modèles d'IA

Un nouveau cadre améliore la compréhension de l'IA des espaces 3D.

2025-08-11T19:14:05+00:00 ― 9 min lire

Son Améliorations dans la technologie d'édition des attributs vocaux

Nouveau modèle permet un contrôle précis des qualités vocales tout en gardant le contenu.

2025-08-11T18:25:30+00:00 ― 5 min lire

Son Faire avancer l'IA dans la génération de texte en audio

Une étude sur l'amélioration des sorties audio à partir de textes en utilisant l'optimisation des préférences.

2025-08-11T07:05:20+00:00 ― 9 min lire

Son Avancées dans la génération musicale automatisée grâce à l'IA

Explorer les récents développements des outils IA pour la création musicale.

2025-08-10T16:30:50+00:00 ― 7 min lire

Son Améliorer le tagging musical avec l'embedding de mots musicaux

Une nouvelle approche améliore le marquage et la récupération de la musique en combinant des termes de langue générale et des termes musicaux.

2025-08-10T06:47:50+00:00 ― 13 min lire

Traitement de l'audio et de la parole FlashSpeech : Un bond en avant dans la synthèse vocale

FlashSpeech propose des solutions de synthèse vocale rapides et de haute qualité.

2025-08-10T03:33:30+00:00 ― 8 min lire

Son Avancées dans la détection des deepfakes avec le cadre RAD

Une nouvelle méthode améliore la détection des deepfakes audio en utilisant des références d'échantillons similaires.

2025-08-10T01:07:45+00:00 ― 7 min lire

Son Mesurer la virtuosité dans la performance de guitare électrique

Cette étude analyse des signaux sonores pour mesurer la virtuosité chez les guitaristes électrique.

2025-08-09T18:39:05+00:00 ― 6 min lire

Son Analyse vocale innovante pour la détection précoce de Parkinson

Des recherches montrent que l'analyse de la parole pourrait aider à identifier la maladie de Parkinson tôt.

2025-08-09T16:24:42+00:00 ― 6 min lire

Son Naviguer dans les vulnérabilités de la reconnaissance des émotions dans la parole

Cette étude examine les faiblesses des modèles SER face aux attaques adversariales dans différentes langues.

2025-08-08T21:35:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancement de l'extraction de la voix du locuteur dans les médias audio-visuels avec SEANet

SEANet améliore l'isolement des intervenants en réduisant le bruit dans le traitement audio.

2025-08-08T20:47:20+00:00 ― 8 min lire

Son SemantiCodec : La prochaine étape dans la technologie audio

Un nouveau codec audio offrant une compression de haute qualité et un contenu sémantique riche.

2025-08-08T19:10:10+00:00 ― 8 min lire

Son Nouvel outil qui analyse le contenu audio et vidéo

Un outil qui combine l'analyse audio et vidéo pour identifier des événements.

2025-08-08T12:41:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Mesurer l'absorption sonore : une nouvelle méthode

Une méthode pour mesurer comment les matériaux absorbent le son efficacement.

2025-08-08T10:46:48+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancées dans la technologie des aides auditives avec l'apprentissage profond

De nouvelles méthodes améliorent la clarté de la parole dans les appareils auditifs grâce à des techniques d'apprentissage profond.

2025-08-08T01:21:20+00:00 ― 8 min lire

Son Localisation de la source sonore : techniques et applications

Apprends les techniques de localisation du son et leur utilisation dans différents domaines.

2025-08-07T23:44:10+00:00 ― 5 min lire

Son S'attaquer à la montée de la détection des deepfakes audio

Nouveau jeu de données et méthodes améliorent la détection des deepfakes audio générés par ALM.

2025-08-07T06:43:55+00:00 ― 8 min lire

Calcul et langage Nouvelle méthode d'attaque qui rend les systèmes ASR muets

Un clip audio universel peut couper des modèles ASR avancés comme Whisper.

2025-08-07T03:29:35+00:00 ― 8 min lire

Son Un nouvel appareil améliore les conversations dans des environnements bruyants

Un appareil aide à se concentrer sur des voix spécifiques dans des endroits bondés.

2025-08-06T19:23:45+00:00 ― 8 min lire

Son Faire avancer le montage audio avec des modèles de diffusion

Une nouvelle méthode améliore le montage audio en utilisant des modèles de diffusion pour des changements précis.

2025-08-06T16:09:25+00:00 ― 7 min lire

Calcul et langage Intégrer des modèles audio et linguistiques : SpeechVerse

SpeechVerse fait le lien entre la compréhension audio et le traitement du langage pour améliorer l'interaction humain-ordinateur.

2025-08-06T06:26:25+00:00 ― 8 min lire

Son Évaluation du biais dans la technologie des assistants vocaux

Nouveau jeu de données met en avant les écarts de performance entre les groupes démographiques utilisant des assistants vocaux.

2025-08-06T02:23:30+00:00 ― 8 min lire

Calcul et langage Examiner la sécurité des modèles de langage

Cet article examine les vulnérabilités des modèles de discours et les moyens d'améliorer leur sécurité.

2025-08-05T23:09:10+00:00 ― 7 min lire