MMTrail combine des descriptions visuelles et audio pour de meilleurs modèles de vidéo-langue.
― 6 min lire
La science de pointe expliquée simplement
MMTrail combine des descriptions visuelles et audio pour de meilleurs modèles de vidéo-langue.
― 6 min lire
TAPTRv2 améliore le suivi des points dans les vidéos en utilisant des mécanismes d'attention pour plus de précision.
― 7 min lire
Une nouvelle méthode pour évaluer la qualité vidéo 4K sans vidéos de référence.
― 7 min lire
SV4D transforme une seule vidéo en une représentation dynamique d'objet 3D.
― 5 min lire
Une méthode pour améliorer l'analyse vidéo en se concentrant sur les régions des images clés.
― 8 min lire
De nouvelles méthodes améliorent l'évaluation de la qualité vidéo en utilisant des techniques d'encodage avancées.
― 9 min lire
AxiomVision propose une nouvelle façon d'analyser les vidéos, améliorant les performances dans des conditions changeantes.
― 8 min lire
BVI-AOM propose une ressource variée pour optimiser les techniques de compression vidéo.
― 7 min lire
Une nouvelle méthode améliore la prévision vidéo en séparant les éléments de la scène pour de meilleures prédictions.
― 8 min lire
Nouveau modèle améliore la synchronisation labiale et la qualité visuelle dans les vidéos de têtes parlantes.
― 8 min lire
Un nouvel outil améliore la reconnaissance des émotions dans les vidéos en utilisant des modèles d'images existants.
― 7 min lire
Une nouvelle méthode améliore la compréhension des vidéos en utilisant des sous-titres pour mieux localiser les moments.
― 8 min lire
La recherche se concentre sur l'amélioration de la qualité vidéo des avatars humains pour des expériences immersives au top.
― 9 min lire
Une nouvelle méthode améliore la qualité vidéo des drones et réduit la consommation d'énergie.
― 11 min lire
Cet article parle de nouvelles méthodes pour améliorer les sous-titres émotionnels des vidéos.
― 8 min lire
Examiner les forces et les faiblesses des systèmes VideoQA pour comprendre le contenu vidéo.
― 7 min lire
Un nouveau cadre améliore comment les modèles reconnaissent les actions dans les vidéos.
― 6 min lire
Une nouvelle méthode améliore la précision de la récupération de moments vidéo en utilisant des stratégies affinées.
― 5 min lire
De nouveaux modèles améliorent la génération vidéo en capturant des relations spatiales et temporelles essentielles.
― 10 min lire
MUSE améliore la précision de la recherche vidéo grâce à l'apprentissage de caractéristiques multi-échelle.
― 6 min lire
ControlCol améliore le contrôle utilisateur dans la colorisation automatique des vidéos.
― 7 min lire
Cette méthode permet aux utilisateurs de contrôler les actions vidéo avec des outils simples.
― 7 min lire
Une nouvelle méthode améliore la génération de vidéos en utilisant deux images fixes pour des transitions fluides.
― 8 min lire
La recherche dévoile des approches innovantes pour restaurer des vidéos floues en mouvement en utilisant des caméras événementielles.
― 5 min lire
Un nouveau cadre améliore la qualité vidéo en faible luminosité et réduit le flou grâce à des caméras événementielles.
― 10 min lire
Kangaroo améliore l'analyse vidéo en intégrant efficacement visuels, sons et textes.
― 7 min lire
Une nouvelle méthode améliore la qualité et l'efficacité de la génération de vidéos.
― 7 min lire
Une nouvelle méthode améliore la façon dont on traite les longues vidéos.
― 7 min lire
Les systèmes HAR améliorent la sécurité en détectant des comportements étranges en temps réel.
― 6 min lire
Une nouvelle méthode combine 2D et 3D pour des vidéos humaines réalistes.
― 8 min lire
Une nouvelle méthode améliore l'alignement des vidéos dans de grands ensembles de données.
― 11 min lire
MRDAC améliore la qualité et la compression des vidéos faciales en utilisant plusieurs images de référence.
― 8 min lire
Une nouvelle méthode pour estimer la profondeur avec précision à partir de séquences vidéo.
― 6 min lire
Un nouveau cadre compte les actions dans les vidéos avec plusieurs personnes de manière précise.
― 7 min lire
Une nouvelle méthode améliore la classification des vidéos en optimisant la sélection des images.
― 9 min lire
Video-XL traite efficacement les longues vidéos, améliorant la précision et la performance.
― 7 min lire
Des équipes s'affrontent pour améliorer les méthodes de prédiction de l'attention sur les vidéos.
― 7 min lire
De nouvelles méthodes améliorent la précision des résumés vidéo tout en réduisant les coûts de calcul.
― 7 min lire
Une nouvelle approche utilise l'IRM en temps réel pour visualiser les mouvements de production de la parole.
― 7 min lire
Cette nouvelle méthode simplifie la génération d'images dans les modèles d'IA, améliorant l'efficacité et la rapidité.
― 7 min lire