Derniers articles pour Audio

Son Équilibrer la vie privée et la surveillance audio intelligente

De nouvelles méthodes visent à protéger la vie privée des discours dans les systèmes de surveillance audio.

2025-09-28T06:30:50+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Détecter les Deepfakes : Un nouveau moyen

Une méthode utilisant l'audio et la vidéo pour mieux détecter les deepfakes.

2025-09-27T19:29:12+00:00 ― 5 min lire

Traitement de l'audio et de la parole Avancées dans la prédiction de la qualité audio avec GML

Un nouveau modèle d'IA améliore la prédiction des scores de qualité audio.

2025-09-24T03:43:40+00:00 ― 7 min lire

Son Générer des sons réalistes à partir de vidéos silencieuses

La recherche explore l'apprentissage profond pour créer de l'audio qui colle avec des vidéos silencieuses.

2025-09-22T04:45:50+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Combiner le son et les visuels pour améliorer la qualité audio

Une nouvelle méthode améliore les enregistrements sonores en utilisant des indices visuels.

2025-09-22T03:57:15+00:00 ― 7 min lire

Interaction homme-machine Le rôle de l'IA dans le storytelling digital

Explorer l'impact du contenu généré par l'IA sur l'art de raconter des histoires.

2025-09-22T02:56:54+00:00 ― 9 min lire

Son Améliorer la qualité sonore des enregistrements quotidiens

Un nouveau système améliore les enregistrements audio pour une meilleure expérience d'écoute.

2025-09-21T15:48:30+00:00 ― 7 min lire

Recherche d'informations Défis d'apprentissage à partir des clips musicaux

Cette étude examine les difficultés d'utilisation de l'apprentissage contrastif pour comprendre les clips musicaux.

2025-09-18T17:21:45+00:00 ― 7 min lire

Son Nouveau modèle améliore l'évaluation de l'intensité de l'alimentation des poissons

Une approche unifiée pour évaluer l'alimentation des poissons en utilisant des données audio et vidéo.

2025-09-14T21:03:15+00:00 ― 6 min lire

Traitement de l'audio et de la parole Améliorer la diarisation des locuteurs avec des modèles de langue

Cet article explore les avancées en diarisation des locuteurs en utilisant des modèles de langue pour plus de précision.

2025-09-14T03:14:25+00:00 ― 6 min lire

Traitement de l'audio et de la parole Le Rôle de l'Audio dans la Détection des Piétons

Des chercheurs examinent la technologie de détection audio pour améliorer la détection des piétons en milieu urbain.

2025-09-14T00:48:40+00:00 ― 7 min lire

Son Nouvelles méthodes pour détecter l'audio généré par l'IA

Techniques avancées pour garantir l'authenticité audio à l'ère du clonage vocal.

2025-09-13T03:40:24+00:00 ― 7 min lire

Son Améliorer la génération audio grâce à des techniques d'alignement de texte

Une nouvelle méthode améliore la génération audio en alignant l'audio avec des descriptions textuelles.

2025-09-11T07:13:25+00:00 ― 7 min lire

Traitement de l'audio et de la parole Améliorer les techniques de détection de discours truqués

De nouvelles méthodes améliorent notre capacité à détecter efficacement les discours falsifiés.

2025-09-11T02:21:55+00:00 ― 7 min lire

Son Améliorer l'entraînement des vocodeurs avec l'apprentissage contrastif

De nouvelles méthodes améliorent la performance des vocodeurs avec des données audio limitées.

2025-09-10T12:36:00+00:00 ― 7 min lire

Cryptographie et sécurité Améliorer la détection des deepfakes grâce à des méthodes d'entraînement variées

Cette étude explore des stratégies de formation pour améliorer la détection des faux audio.

2025-09-09T22:01:30+00:00 ― 7 min lire

Son Une nouvelle méthode pour détecter le spoofing vocal

Une approche solide pour identifier les anomalies audio et lutter contre le spoofing vocal.

2025-09-09T07:27:00+00:00 ― 6 min lire

Calcul et langage Avancées dans l'identification de la langue parlée

De nouvelles méthodes combinent l'audio et les métadonnées pour une meilleure reconnaissance des langues.

2025-09-08T07:09:30+00:00 ― 7 min lire

Son Avancées dans la synthèse musicale multi-instrumentale

Une nouvelle méthode améliore la génération de musique en ajoutant du contexte de performance.

2025-09-07T01:11:55+00:00 ― 8 min lire

Son Faire avancer la recherche musicale avec l'apprentissage auto-supervisé

Une nouvelle approche utilise l'apprentissage auto-supervisé pour relier l'audio et la partition.

2025-09-06T21:09:00+00:00 ― 7 min lire

Son Lier l'audio et la partition avec des réseaux récurrents

Une nouvelle méthode améliore l'accord entre audio et partitions.

2025-09-06T19:31:50+00:00 ― 7 min lire

Son Nouvelle technique de filigrane pour les modèles audio

Une nouvelle méthode pour marquer des audios créés par des modèles de diffusion pour protéger les droits d'auteur.

2025-09-06T04:08:45+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes AVI-Talking : Une nouvelle façon de créer des visages animés expressifs

AVI-Talking crée des visages 3D hyper réalistes qui expriment des émotions à travers le son.

2025-09-04T10:11:30+00:00 ― 7 min lire

Traitement du signal Une nouvelle approche pour identifier les symptômes de la schizophrénie

Combiner audio, vidéo et texte pour de meilleures évaluations de santé mentale.

2025-09-03T22:42:15+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la génération de vidéos de visages parlants

De nouvelles méthodes améliorent le réalisme des humains numériques et des avatars.

2025-09-03T03:38:42+00:00 ― 5 min lire

Son Combiner voix et visage pour une meilleure identification

Une nouvelle méthode améliore la vérification des locuteurs en combinant les données audio et visuelles.

2025-09-02T07:50:15+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Détecter l'humour dans les vidéos avec FunnyNet-W

Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.

2025-08-30T23:09:25+00:00 ― 8 min lire

Traitement de l'audio et de la parole Progrès en traitement multimodal avec CoAVT

CoAVT intègre des données audio, visuelles et textuelles pour une meilleure compréhension.

2025-08-28T12:02:50+00:00 ― 9 min lire

Son Audio Flamingo : Un nouveau modèle pour comprendre le son

Audio Flamingo excelle à écouter, discuter et s'adapter à de nouvelles tâches audio.

2025-08-26T16:19:20+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la communication humaine grâce à la modélisation du mouvement

Un nouveau modèle génère des mouvements réalistes dans les conversations, améliorant la compréhension des interactions.

2025-08-24T15:59:36+00:00 ― 7 min lire

Calcul et langage Détection en temps réel des problèmes de conversation avec l'IA

Un nouveau modèle améliore la détection des pannes de dialogue pour les systèmes d'IA.

2025-08-20T13:38:18+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes SonicDiffusion : Fusion de la création sonore et visuelle

Une nouvelle méthode pour créer et éditer des images en utilisant des signaux audio.

2025-08-14T22:56:36+00:00 ― 8 min lire

Traitement de l'audio et de la parole CLaM-TTS : Faire avancer la technologie de la synthèse vocale

CLaM-TTS améliore la synthèse vocale en utilisant des techniques avancées pour plus d'efficacité et de qualité.

2025-08-13T08:28:55+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la génération de gestes avec CoCoGesture

CoCoGesture crée des gestes réalistes qui correspondent aux mots prononcés, rendant l'interaction plus sympa.

2025-08-06T05:04:00+00:00 ― 6 min lire

Calcul et langage Avancées dans la traduction des signaux MEG en texte

Un nouveau cadre convertit les signaux MEG en texte significatif, aidant la technologie de communication.

2025-08-03T03:43:42+00:00 ― 13 min lire

Son Transformer le sous-titrage audio grâce à des méthodes innovantes

Une nouvelle approche pour la légende audio réduit la dépendance aux données appairées.

2025-07-30T21:24:10+00:00 ― 7 min lire

Traitement de l'audio et de la parole Utiliser la technologie audio pour le suivi des piétons

Cette étude examine les méthodes audio pour suivre les mouvements des piétons dans les zones urbaines.

2025-07-29T17:52:20+00:00 ― 9 min lire

Traitement de l'audio et de la parole AV-CrossNet : Améliorer la reconnaissance vocale dans le bruit

Un nouveau système aide à séparer la parole du bruit pour une communication plus claire.

2025-07-29T03:17:50+00:00 ― 8 min lire

Robotique Apprendre avec le son : une nouvelle ère pour les robots

Un nouveau système aide les robots à apprendre des tâches en utilisant des audio de démonstrations réelles.

2025-07-26T09:42:35+00:00 ― 9 min lire

Apprentissage automatique Combiner texte et audio pour mieux classer les émotions

Une étude sur l'utilisation de données textuelles et audio pour améliorer la reconnaissance des émotions.

2025-07-22T23:55:06+00:00 ― 8 min lire