Une nouvelle méthode améliore la clarté des enregistrements de guitare électrique en s'attaquant aux effets de distorsion.

2025-07-11T20:43:10+00:00 ― 9 min lire

Son Transformer la musique grâce à la technologie AP-Adapter

Un nouvel outil améliore la façon dont les utilisateurs éditent des morceaux de musique de manière efficace.

2025-07-11T19:06:00+00:00 ― 6 min lire

Son Analyse des cris de tamarins avec des techniques modernes

Étudier les vocalisations des ouistitis en utilisant des méthodes de classification avancées et l'analyse audio.

2025-07-11T16:40:15+00:00 ― 7 min lire

Calcul et langage Optimisation de la correction des erreurs ASR avec des modèles de langue

Une étude sur l'amélioration de la précision de la transcription grâce à une meilleure conception des invites.

2025-07-11T15:03:05+00:00 ― 7 min lire

Calcul et langage Comprendre le raisonnement sur les sentiments dans l'IA de la santé

Un cadre pour améliorer l'analyse de sentiments de l'IA dans les conversations de santé.

2025-07-11T11:00:10+00:00 ― 7 min lire

Son Améliorer la sécurité des appareils activés par la voix

Combiner des mots de réveil et la reconnaissance vocale améliore la sécurité dans la technologie vocale.

2025-07-11T06:57:15+00:00 ― 7 min lire

Son Améliorer la reconnaissance des émotions dans la parole dans des environnements bruyants

Une nouvelle approche améliore les systèmes de reconnaissance vocale en utilisant des descriptions de l'environnement sonore.

2025-07-11T06:08:40+00:00 ― 8 min lire

Calcul et langage Avancées dans la technologie de traduction vocale

Un nouveau modèle vise à améliorer la qualité de la traduction vocale grâce à des systèmes intégrés.

2025-07-11T02:54:20+00:00 ― 7 min lire

Son L'essor du montage vocal dans les médias numériques

Explore l'importance croissante du montage audio pour les créateurs de contenu.

2025-07-11T00:28:35+00:00 ― 7 min lire

Son Avancées dans la technologie de synthèse vocale multi-locuteurs

De nouvelles techniques améliorent la génération de voix synthétiques avec un minimum de données.

2025-07-10T23:40:00+00:00 ― 7 min lire

Traitement de l'audio et de la parole Une nouvelle méthode révèle les secrets de communication des cachalots

Un nouvel outil analyse les codas des cachalots pour comprendre leurs interactions sociales.

2025-07-10T22:51:25+00:00 ― 7 min lire

Son Avancées dans l'analyse des sons cardiaques

Une étude améliore l'estimation du rythme cardiaque et la détection des souffles avec des enregistrements.

2025-07-10T13:08:25+00:00 ― 7 min lire

Informatique neuronale et évolutive Explorer l'impact de la musique sur les réactions du cerveau

Des recherches montrent comment la musique influence l'activité cérébrale en utilisant l'intelligence d'organoïdes.

2025-07-10T12:19:50+00:00 ― 11 min lire

Son Évaluer le raisonnement dans les modèles audio-langage

Cette étude évalue les compétences en raisonnement des modèles audio-langage avec une nouvelle tâche.

2025-07-10T09:54:05+00:00 ― 9 min lire

Calcul et langage Avancées dans la reconnaissance vocale pour les langues à ressources limitées

De nouvelles méthodes améliorent les systèmes de parole pour les langues sous-représentées.

2025-07-10T04:14:00+00:00 ― 7 min lire

Son Approche innovante pour la formation d'assistants vocaux

Combiner la synthèse vocale et des données réelles améliore efficacement les systèmes de reconnaissance vocale.

2025-07-10T00:59:40+00:00 ― 5 min lire

Son Avancées dans l'expansion de la bande passante vocale

Améliorer la qualité audio sur les appareils grâce à des techniques d'élargissement de bande passante.

2025-07-10T00:11:05+00:00 ― 7 min lire

Son Avancées dans les interfaces de langage silencieux

Une nouvelle méthode améliore la conversion de la parole silencieuse en audio compréhensible.

2025-07-09T22:33:55+00:00 ― 7 min lire

Son Avancer la classification audio avec de nouvelles techniques d'apprentissage

Une méthode qui améliore la reconnaissance sonore dans les machines.

2025-07-09T17:42:25+00:00 ― 7 min lire

Son Avancées dans les techniques de séparation de la parole audio-visuelle

Une nouvelle méthode améliore la séparation des voix dans des environnements bruyants avec plusieurs intervenants.

2025-07-09T16:53:50+00:00 ― 6 min lire

Traitement de l'audio et de la parole Une nouvelle méthode pour mesurer la signification du son

Cette étude présente une méthode pour évaluer le sens des signaux sonores.

2025-07-09T16:05:15+00:00 ― 7 min lire

Son Avancées dans le sous-titrage musical avec FUTGA

Le modèle FUTGA améliore la compréhension de la musique grâce à des descriptions détaillées et spécifiques au temps.

2025-07-09T08:48:00+00:00 ― 7 min lire

Son Approches innovantes à l'harmonisation des mélodies

Une nouvelle méthode musicale améliore l'expression émotionnelle grâce à une attention particulière aux tonalités.

2025-07-09T01:30:45+00:00 ― 6 min lire

Son Avancées dans les technologies de détection vocale

La recherche combine l'amélioration de la parole et l'apprentissage par transfert pour de meilleurs systèmes anti-fraude.

2025-07-08T23:53:35+00:00 ― 10 min lire

Son Avancées dans les techniques de génération de musique par IA

De nouvelles méthodes améliorent la capacité de l'IA à créer de la musique structurée.

2025-07-08T20:39:15+00:00 ― 7 min lire

Son Wavespace : Révolutionne le jeu dans le design sonore

Wavespace propose des outils innovants pour mieux créer et contrôler le son.

2025-07-08T19:02:05+00:00 ― 8 min lire

Traitement de l'audio et de la parole Améliorer la détection de mots-clés dans des environnements bruyants

Un nouveau système améliore la reconnaissance des commandes vocales malgré le bruit de fond.

2025-07-08T18:13:30+00:00 ― 7 min lire

Son Améliorer la transcription de batterie avec des données synthétiques améliorées

De nouvelles stratégies visent à améliorer les ensembles de données synthétiques pour une meilleure transcription de batterie.

2025-07-08T17:24:55+00:00 ― 9 min lire

Traitement de l'audio et de la parole Améliorer les technologies de reconnaissance de la parole chuchotée

De nouvelles méthodes visent à améliorer la reconnaissance de la parole chuchotée dans les systèmes automatiques.

2025-07-08T08:30:30+00:00 ― 8 min lire

Son Utiliser l'analyse audio pour détecter l'insuffisance respiratoire

Des modèles de deep learning analysent des enregistrements vocaux pour identifier une insuffisance respiratoire et estimer les niveaux d'oxygène.

2025-07-08T07:41:55+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes MMTrail : Un ensemble de données vidéo complet pour les modèles de langage

MMTrail combine des descriptions visuelles et audio pour de meilleurs modèles de vidéo-langue.

2025-07-08T06:53:20+00:00 ― 6 min lire

Son Une nouvelle approche pour générer de la musique au piano basée sur les émotions

Cette méthode améliore la génération musicale en séparant les aspects émotionnels en valence et en excitation.

2025-07-08T06:04:45+00:00 ― 7 min lire

Son Présentation de PiCoGen : Une nouvelle façon de créer des covers de piano

PiCoGen propose une méthode innovante pour créer des covers de piano sans données appariées.

2025-07-08T04:27:35+00:00 ― 6 min lire

Son Traiter les propos abusifs dans l'audio

La recherche se concentre sur l'identification du discours abusif dans des enregistrements audio à travers différentes langues.

2025-07-08T02:50:25+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Générer de l'audio synchronisé pour des vidéos silencieuses

Une méthode pour créer des audio qui correspondent aux vidéos en vue à la première personne.

2025-07-07T23:36:05+00:00 ― 9 min lire

Son Avancer le suivi du rythme dans l'analyse musicale

Un nouveau système améliore le suivi des rythmes dans différents genres musicaux.

2025-07-07T15:30:15+00:00 ― 7 min lire

Son Génération de musique IA : Préférences des auditeurs en metal progressif

Une étude révèle l'avis des auditeurs sur la musique générée par IA par rapport à celle des humains.

2025-07-07T13:53:05+00:00 ― 10 min lire

Son Amélioration de la détection de la compression audio avec perte

Une étude sur l'amélioration des méthodes pour détecter la compression audio avec perte pour une meilleure qualité sonore.

2025-07-07T12:15:55+00:00 ― 7 min lire

Son Évaluer les grands modèles de langage dans la création musicale

Cette étude examine à quel point les LLM comprennent et génèrent de la musique.

2025-07-07T10:38:45+00:00 ― 7 min lire

Son Génération de musique MIDI : défis actuels et pistes d'avenir

Un aperçu de la création musicale MIDI et de son potentiel expressif.

2025-07-07T00:55:45+00:00 ― 7 min lire

Informatique - Son