De nouvelles méthodes visent à protéger la vie privée des discours dans les systèmes de surveillance audio.
― 7 min lire
La science de pointe expliquée simplement
De nouvelles méthodes visent à protéger la vie privée des discours dans les systèmes de surveillance audio.
― 7 min lire
Une méthode utilisant l'audio et la vidéo pour mieux détecter les deepfakes.
― 5 min lire
Un nouveau modèle d'IA améliore la prédiction des scores de qualité audio.
― 7 min lire
La recherche explore l'apprentissage profond pour créer de l'audio qui colle avec des vidéos silencieuses.
― 9 min lire
Une nouvelle méthode améliore les enregistrements sonores en utilisant des indices visuels.
― 7 min lire
Explorer l'impact du contenu généré par l'IA sur l'art de raconter des histoires.
― 9 min lire
Un nouveau système améliore les enregistrements audio pour une meilleure expérience d'écoute.
― 7 min lire
Cette étude examine les difficultés d'utilisation de l'apprentissage contrastif pour comprendre les clips musicaux.
― 7 min lire
Une approche unifiée pour évaluer l'alimentation des poissons en utilisant des données audio et vidéo.
― 6 min lire
Cet article explore les avancées en diarisation des locuteurs en utilisant des modèles de langue pour plus de précision.
― 6 min lire
Des chercheurs examinent la technologie de détection audio pour améliorer la détection des piétons en milieu urbain.
― 7 min lire
Techniques avancées pour garantir l'authenticité audio à l'ère du clonage vocal.
― 7 min lire
Une nouvelle méthode améliore la génération audio en alignant l'audio avec des descriptions textuelles.
― 7 min lire
De nouvelles méthodes améliorent notre capacité à détecter efficacement les discours falsifiés.
― 7 min lire
De nouvelles méthodes améliorent la performance des vocodeurs avec des données audio limitées.
― 7 min lire
Cette étude explore des stratégies de formation pour améliorer la détection des faux audio.
― 7 min lire
Une approche solide pour identifier les anomalies audio et lutter contre le spoofing vocal.
― 6 min lire
De nouvelles méthodes combinent l'audio et les métadonnées pour une meilleure reconnaissance des langues.
― 7 min lire
Une nouvelle méthode améliore la génération de musique en ajoutant du contexte de performance.
― 8 min lire
Une nouvelle approche utilise l'apprentissage auto-supervisé pour relier l'audio et la partition.
― 7 min lire
Une nouvelle méthode améliore l'accord entre audio et partitions.
― 7 min lire
Une nouvelle méthode pour marquer des audios créés par des modèles de diffusion pour protéger les droits d'auteur.
― 8 min lire
AVI-Talking crée des visages 3D hyper réalistes qui expriment des émotions à travers le son.
― 7 min lire
Combiner audio, vidéo et texte pour de meilleures évaluations de santé mentale.
― 7 min lire
De nouvelles méthodes améliorent le réalisme des humains numériques et des avatars.
― 5 min lire
Une nouvelle méthode améliore la vérification des locuteurs en combinant les données audio et visuelles.
― 6 min lire
Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.
― 8 min lire
CoAVT intègre des données audio, visuelles et textuelles pour une meilleure compréhension.
― 9 min lire
Audio Flamingo excelle à écouter, discuter et s'adapter à de nouvelles tâches audio.
― 7 min lire
Un nouveau modèle génère des mouvements réalistes dans les conversations, améliorant la compréhension des interactions.
― 7 min lire
Un nouveau modèle améliore la détection des pannes de dialogue pour les systèmes d'IA.
― 10 min lire
Une nouvelle méthode pour créer et éditer des images en utilisant des signaux audio.
― 8 min lire
CLaM-TTS améliore la synthèse vocale en utilisant des techniques avancées pour plus d'efficacité et de qualité.
― 8 min lire
CoCoGesture crée des gestes réalistes qui correspondent aux mots prononcés, rendant l'interaction plus sympa.
― 6 min lire
Un nouveau cadre convertit les signaux MEG en texte significatif, aidant la technologie de communication.
― 13 min lire
Une nouvelle approche pour la légende audio réduit la dépendance aux données appairées.
― 7 min lire
Cette étude examine les méthodes audio pour suivre les mouvements des piétons dans les zones urbaines.
― 9 min lire
Un nouveau système aide à séparer la parole du bruit pour une communication plus claire.
― 8 min lire
Un nouveau système aide les robots à apprendre des tâches en utilisant des audio de démonstrations réelles.
― 9 min lire
Une étude sur l'utilisation de données textuelles et audio pour améliorer la reconnaissance des émotions.
― 8 min lire