Une nouvelle méthode aide les robots à retrouver des objets tombés en utilisant le son.

2025-07-16T06:47:35+00:00 ― 6 min lire

Son Avancées dans les systèmes de drones contrôlés par la voix

De nouveaux systèmes de commande vocale améliorent le contrôle des drones sans avoir besoin des mains.

2025-07-16T05:42:18+00:00 ― 7 min lire

Son Avancées dans la modélisation des amplis de guitare

De nouvelles techniques permettent une meilleure émulation des amplis de guitare et des effets.

2025-07-15T23:30:20+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale avec mélange de langues grâce à la distillation de connaissances

Un nouveau cadre améliore la performance de l'ASR en utilisant des données et des ressources limitées.

2025-07-15T22:41:45+00:00 ― 7 min lire

Son Faire avancer la synthèse audio avec des modèles de diffusion

Une nouvelle méthode améliore l'efficacité de la génération audio en utilisant des techniques d'attention innovantes.

2025-07-15T20:16:00+00:00 ― 6 min lire

Son BandControlNet : Une nouvelle approche de la création musicale

Découvrez comment l'IA transforme la génération de musique avec BandControlNet.

2025-07-15T19:27:25+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouvelle méthode pour détecter les deepfakes

Une nouvelle méthode améliore la détection des deepfakes en utilisant une analyse audio-visuelle.

2025-07-15T12:10:10+00:00 ― 7 min lire

Son L'évolution des systèmes de reconnaissance vocale automatique

Un aperçu des avancées dans les technologies et méthodes de reconnaissance vocale.

2025-07-15T11:21:35+00:00 ― 6 min lire

Son Améliorer la détection du bégaiement avec MMSD-Net

Une nouvelle méthode améliore la détection du bégaiement en combinant des données audio, vidéo et textuelles.

2025-07-15T07:18:40+00:00 ― 7 min lire

Son Génération sonore innovante pour des modèles humains 3D

Une nouvelle méthode améliore la création de sons pour des modèles humains 3D réalistes.

2025-07-15T00:01:25+00:00 ― 8 min lire

Son Estimation du taux de respiration par l'analyse de la parole

Cette étude montre comment la parole peut estimer les taux de respiration en utilisant des modèles avancés.

2025-07-14T23:12:50+00:00 ― 7 min lire

Son GraphMuse : Un nouvel outil pour l'analyse musicale

GraphMuse simplifie l'analyse des données musicales symboliques avec des techniques avancées de machine learning.

2025-07-14T19:58:30+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer la reconnaissance vocale pour la langue polonaise

La recherche présente de nouvelles méthodes pour évaluer les systèmes de reconnaissance vocale en polonais.

2025-07-14T16:44:10+00:00 ― 8 min lire

Traitement de l'audio et de la parole MSceneSpeech : Faire avancer la synthèse vocale en mandarin

Un nouveau jeu de données améliore la parole des machines pour le mandarin, visant une expression naturelle.

2025-07-14T09:26:55+00:00 ― 7 min lire

Multimédia Améliorer la localisation des sources sonores grâce à l'intégration audio-visuelle

Une étude sur l'amélioration de la localisation des sources sonores en utilisant mieux les infos audio et visuelles.

2025-07-14T06:12:35+00:00 ― 9 min lire

Apprentissage automatique Évaluer la santé cognitive à travers l'analyse de la parole

Un nouveau cadre analyse la parole pour identifier les légers troubles cognitifs dans plusieurs langues.

2025-07-14T05:24:00+00:00 ― 7 min lire

Son L'IA et le défi des genres musicaux variés

Explorer l'impact de l'IA sur les styles de musique sous-représentés.

2025-07-14T02:58:15+00:00 ― 7 min lire

Calcul et langage Améliorer la synthèse vocale pour les langues indiennes

Une méthode pour améliorer les systèmes TTS pour mieux prononcer les mots OOV en Inde.

2025-07-14T02:09:40+00:00 ― 7 min lire

Son Avancées dans la technologie des appareils auditifs grâce à l'apprentissage automatique

De nouveaux modèles d'apprentissage automatique améliorent la clarté de la parole pour les utilisateurs d'appareils auditifs.

2025-07-13T23:43:55+00:00 ― 7 min lire

Son Étudier les interactions sociales avec de l'audio basse fréquence

La recherche explore l'audio basse fréquence pour protéger la vie privée dans les études sur le comportement social.

2025-07-13T21:18:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Comprendre la propagation du son dans des espaces connectés

Explorer comment le son se comporte dans des environnements multi-pièces et ses implications dans la technologie.

2025-07-13T20:29:35+00:00 ― 7 min lire

Traitement de l'audio et de la parole Les outils d'IA transforment le processus de montage musical

De nouveaux outils d'IA simplifient le montage musical avec des techniques innovantes et une précision améliorée.

2025-07-13T18:52:25+00:00 ― 6 min lire

Calcul et langage Une nouvelle approche de la traduction vocale : correspondance de voix prédéfinies

Le matching de voix prédéfini améliore la traduction vocale tout en garantissant la vie privée et en réduisant les risques.

2025-07-13T18:03:50+00:00 ― 7 min lire

Son Assistant de Compositeur 2 : Un nouvel outil pour les musiciens

Un nouveau système aide les musiciens à créer de la musique avec plus de contrôle et de précision.

2025-07-13T14:00:55+00:00 ― 9 min lire

Son Évaluer l'impact de l'IA sur l'originalité de la musique

Un nouvel outil pour évaluer la répétition dans la musique générée par l'IA.

2025-07-13T12:23:45+00:00 ― 9 min lire

Son Génération Audio Ouverte : Un Nouveau Modèle

Un nouveau modèle de texte à audio utilisant uniquement des données publiques.

2025-07-13T11:35:10+00:00 ― 7 min lire

Calcul et langage Rasa : Une avancée dans la synthèse vocale des langues indiennes

Le dataset Rasa fait avancer la synthèse vocale pour les langues indiennes avec une voix neutre et expressive.

2025-07-13T05:55:05+00:00 ― 8 min lire

Son Avancées dans la technologie de reconnaissance des émotions dans la voix

De nouvelles méthodes améliorent la compréhension des émotions humaines dans la parole par les machines.

2025-07-12T18:34:55+00:00 ― 5 min lire

Son Rendre les outils d'IA accessibles aux artistes

Simplifier les outils d'IA peut aider les artistes à améliorer leur expression créative.

2025-07-12T17:46:20+00:00 ― 6 min lire

Son MusiConGen : Faire avancer la techno texte-en-musique

MusiConGen améliore le contrôle des utilisateurs dans la génération de texte en musique.

2025-07-12T16:57:45+00:00 ― 8 min lire

Neurones et cognition Progrès de la technologie EEG pour la récupération de la parole

Des chercheurs améliorent le décodage de la parole en utilisant l'EEG pour aider les personnes ayant des troubles de la parole.

2025-07-12T16:20:33+00:00 ― 9 min lire

Calcul et langage Présentation de J-CHAT : un nouveau jeu de données pour la recherche sur le dialogue oral

J-CHAT propose un grand jeu de données open-source pour améliorer les systèmes de dialogue parlé.

2025-07-12T12:06:15+00:00 ― 7 min lire

Traitement de l'audio et de la parole Avancées dans la création d'instruments de musique basés sur des échantillons

De nouvelles méthodes permettent aux musiciens de créer des instruments à partir de sons donnés.

2025-07-12T08:51:55+00:00 ― 7 min lire

Traitement de l'audio et de la parole Codecs vocaux et préservation des émotions

Examiner comment les codecs gardent les émotions dans les données vocales.

2025-07-12T06:26:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Transformer la diffusion avec la technologie IP et le marquage audio

Découvrez comment la diffusion IP et le marquage audio transforment la livraison de contenu.

2025-07-12T05:37:35+00:00 ― 7 min lire

Interaction homme-machine Les humains et les robots créent de la musique ensemble

Un aperçu de comment la technologie et les musiciens collaborent dans une performance unique.

2025-07-12T03:11:50+00:00 ― 9 min lire

Robotique Musicien Robotique Améliore l'Expérience de Shopping

Un robot joue de la musique dans un magasin pour améliorer le kiff des clients.

2025-07-12T02:23:15+00:00 ― 9 min lire

Traitement de l'audio et de la parole Un système d'égalisation automatique révolutionne la production musicale

Une nouvelle tech simplifie l'égalisation pour les enregistrements audio.

2025-07-11T23:08:55+00:00 ― 6 min lire

Traitement de l'audio et de la parole Avancement de l'appariement de son de synthétiseur avec le Transformateur de Spectrogramme Audio

Une nouvelle méthode simplifie l'accord des sons de synthétiseur pour les musiciens.

2025-07-11T21:31:45+00:00 ― 7 min lire

Son Améliorer la récupération de la distorsion dans les enregistrements de guitare

Une nouvelle méthode améliore la clarté des enregistrements de guitare électrique en s'attaquant aux effets de distorsion.

2025-07-11T20:43:10+00:00 ― 9 min lire

Informatique - Son