Améliorer la façon dont on identifie les sources sonores en utilisant des données audio-visuelles.
― 8 min lire
La science de pointe expliquée simplement
Améliorer la façon dont on identifie les sources sonores en utilisant des données audio-visuelles.
― 8 min lire
Une méthode pour visualiser et prédire des sons dans différents environnements en utilisant une technologie avancée.
― 6 min lire
Une nouvelle approche pour améliorer la qualité et l'efficacité énergétique du streaming vidéo en direct sur mobile.
― 11 min lire
ChatDiet combine des données personnelles et des connaissances de la population pour des conseils alimentaires améliorés.
― 10 min lire
Une analyse des biais et de l'incivilité dans les débats télévisés indiens.
― 7 min lire
Un nouveau cadre améliore l'efficacité et la qualité de la compression vidéo.
― 7 min lire
Cet article examine comment les images ont influencé l'opinion publique pendant le conflit Russie-Ukrainien.
― 5 min lire
Une nouvelle méthode améliore la qualité des images lors de la transmission sans fil sur des canaux bruyants.
― 6 min lire
MemeCraft crée des memes engageants pour promouvoir des causes sociales en toute sécurité.
― 14 min lire
Une nouvelle méthode améliore l'apprentissage machine des données audio-visuelles.
― 7 min lire
Des recherches montrent des façons plus larges de donner des directions en utilisant la connaissance spatiale.
― 9 min lire
Combiner audio, vidéo et texte pour de meilleures évaluations de santé mentale.
― 7 min lire
Un nouveau cadre améliore la synchronisation labiale et la qualité visuelle dans les vidéos de visages qui parlent.
― 7 min lire
Une nouvelle méthode génère des faux échantillons défectueux pour améliorer la détection des anomalies dans la fabrication.
― 8 min lire
Une nouvelle méthode améliore la vérification des locuteurs en combinant les données audio et visuelles.
― 6 min lire
Une nouvelle méthode améliore le suivi des intervenants en utilisant des données audio et visuelles.
― 8 min lire
MusicAOG simplifie la création et la compréhension de la musique grâce à une représentation graphique innovante.
― 8 min lire
Analyser le stress et la dépression peut améliorer notre compréhension de la santé mentale.
― 8 min lire
Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.
― 8 min lire
AesopAgent permet aux utilisateurs de créer des vidéos à partir d'histoires grâce à des outils d'IA avancés.
― 6 min lire
Examiner comment les images influencent l'apprentissage dans les articles de Wikipédia.
― 7 min lire
Une méthode pour réduire la redondance dans les représentations de données multi-vues.
― 8 min lire
CoAVT intègre des données audio, visuelles et textuelles pour une meilleure compréhension.
― 9 min lire
Crée des vidéos avec des avatars qui parlent facilement grâce au système innovant de Virbo.
― 9 min lire
Le dataset WiMANS permet de suivre les activités de plusieurs utilisateurs grâce aux signaux WiFi.
― 9 min lire
Un nouveau cadre simplifie les tâches de montage vidéo en utilisant des outils de retouche photo.
― 11 min lire
BDoG améliore le raisonnement de l'IA en intégrant efficacement différents types de données.
― 9 min lire
Heracles combine des transformateurs et des modèles d'état pour améliorer le traitement des données.
― 7 min lire
Une nouvelle méthode intègre des infos acoustiques dans les modèles de langage pour améliorer la reconnaissance vocale.
― 11 min lire
Utiliser la musique pour expliquer le cancer peut améliorer la compréhension et l'engagement.
― 8 min lire
Un nouveau cadre améliore la complétion des graphes de connaissances avec des types de données variés.
― 10 min lire
Une nouvelle façon d'animer des portraits avec des expressions et des angles qui changent.
― 8 min lire
Une nouvelle méthode améliore la compression des données 3D tout en gardant la qualité.
― 11 min lire
CIRP améliore la représentation des articles pour un meilleur regroupement de produits en ligne.
― 10 min lire
Explorer comment l'IoS pourrait transformer nos expériences numériques en engageant tous nos sens.
― 14 min lire
DIBS améliore le sous-titrage des événements vidéo en affinant les limites avec des données non étiquetées.
― 10 min lire
Combiner des images et du texte améliore la précision dans l'estimation de la profondeur 3D.
― 8 min lire
WebXR transforme notre façon d'interagir avec des environnements numériques immersifs.
― 11 min lire
Une nouvelle méthode améliore la synthèse vocale pour les personnes qui ne peuvent pas parler.
― 9 min lire
AniFrame rend l'art de la programmation accessible aux débutants grâce à une approche facile à utiliser.
― 8 min lire