HandFormer améliore la reconnaissance des actions en utilisant des poses de main 3D et des images.
― 7 min lire
La science de pointe expliquée simplement
HandFormer améliore la reconnaissance des actions en utilisant des poses de main 3D et des images.
― 7 min lire
Une nouvelle méthode améliore la génération d'images à partir de texte avec des transitions fluides et une haute qualité.
― 7 min lire
Une nouvelle méthode améliore la modélisation 3D à partir d'images 2D.
― 8 min lire
OfCaM améliore la précision du suivi des mouvements humains grâce aux vidéos.
― 7 min lire
Nouveau modèle qui combine le langage naturel et le contact main-objet en 3D pour plus de réalisme.
― 5 min lire
Examiner les forces et les faiblesses des systèmes VideoQA pour comprendre le contenu vidéo.
― 7 min lire
Présentation d'une méthode pour améliorer le question-réponse dans les vidéos avec plusieurs événements.
― 8 min lire
Une nouvelle méthode améliore la réponse aux questions vidéo grâce à la reconnaissance de texte dans les scènes.
― 9 min lire
Découvre comment la reconstruction de scènes 3D change la technologie et les interactions.
― 7 min lire