Cette étude explore comment les machines relient les actions à leurs résultats grâce à l'analyse vidéo.
― 9 min lire
La science de pointe expliquée simplement
Cette étude explore comment les machines relient les actions à leurs résultats grâce à l'analyse vidéo.
― 9 min lire
Un cadre pour rendre les prédictions vidéo compréhensibles et fiables.
― 7 min lire
FineBio propose un ensemble de données pour suivre les actions dans les expériences biologiques via vidéo.
― 8 min lire
M-RAAP optimise l'association des données vidéo et texte pour de meilleurs résultats de recherche.
― 7 min lire
Une nouvelle méthode améliore la segmentation audio-visuelle sans étiquettes détaillées.
― 7 min lire
Un nouveau jeu de données améliore la capacité de l'IA à interpréter le comportement humain dans les vidéos.
― 9 min lire
Un ensemble de données pour évaluer les difficultés lors des tâches d'assemblage en utilisant des annotations vidéo.
― 10 min lire
UniVS simplifie les tâches de segmentation vidéo en utilisant des invites pour de meilleures performances et polyvalence.
― 8 min lire
TV-TREES améliore la réponse aux questions vidéo avec des structures de raisonnement claires.
― 6 min lire
Cette recherche examine le passage des actions intentionnelles aux actions non intentionnelles dans les vidéos.
― 5 min lire
Un nouveau système identifie les actions des élèves dans les vidéos de classe avec une grande efficacité.
― 7 min lire
Une nouvelle méthode améliore la détection des relations dans les vidéos en utilisant des modèles spécialisés.
― 10 min lire
Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.
― 8 min lire
Une approche innovante pour reconnaître et localiser les comportements de conduite distraits.
― 12 min lire
Une nouvelle méthode améliore la réponse aux questions vidéo tout en gardant les connaissances antérieures.
― 8 min lire
Mamba montre un fort potentiel dans l'analyse vidéo par rapport aux transformateurs.
― 8 min lire
HawkEye améliore les modèles vidéo-texte pour traiter les vidéos plus longues efficacement.
― 7 min lire
Une nouvelle approche simplifie le grounding vidéo en éliminant le besoin d'étiquettes temporelles précises.
― 9 min lire
DINO Tracker améliore le suivi des points vidéo, gérant les occlusions de manière efficace.
― 9 min lire
Une nouvelle méthode améliore l'identification des événements inhabituels dans les vidéos.
― 10 min lire
Apprends comment la taille des patchs augmente l'efficacité des modèles d'apprentissage profond.
― 5 min lire
Une nouvelle approche utilise des modèles de langage pour une analyse efficace de vidéos longues.
― 7 min lire
Une nouvelle méthode améliore la reconnaissance d'actions dans des vidéos non montées en utilisant peu d'exemples.
― 11 min lire
Annolid automatise le suivi des animaux dans les vidéos, aidant les chercheurs à étudier leur comportement.
― 6 min lire
De nouvelles méthodes améliorent la détection d'action vidéo face à diverses corruptions.
― 7 min lire
Le modèle ASTRA améliore la précision dans l'identification des actions pendant les matchs de foot.
― 8 min lire
DIBS améliore le sous-titrage des événements vidéo en affinant les limites avec des données non étiquetées.
― 10 min lire
Une nouvelle méthode pour identifier et décrire des objets dans des vidéos.
― 8 min lire
Une nouvelle approche 3D améliore la précision du suivi de mouvement dans les vidéos.
― 7 min lire
SportsHHI se concentre sur les interactions humaines dans les vidéos de basket et de volley pour une analyse améliorée.
― 7 min lire
Une nouvelle méthode améliore la mesure de la fréquence cardiaque en utilisant l'analyse vidéo et la modélisation faciale en 3D.
― 9 min lire
Un nouveau système améliore la capture de mouvement 3D à partir de vidéos en 2D.
― 7 min lire
SPAM propose une manière plus intelligente de taguer les données vidéo efficacement.
― 7 min lire
Cette étude améliore la segmentation des objets en mouvement en utilisant SAM combiné avec des techniques de flux optique.
― 9 min lire
Pegasus-1 permet aux utilisateurs d'interagir avec des vidéos en utilisant un langage naturel.
― 8 min lire
MovieChat simplifie la compréhension des vidéos longues en utilisant des techniques de gestion de mémoire efficaces.
― 7 min lire
Une nouvelle méthode améliore comment on compte les actions dans les vidéos en utilisant des exemples.
― 6 min lire
De nouvelles méthodes améliorent la compréhension et l'analyse des événements inhabituels dans les vidéos.
― 6 min lire
Présentation de LVOS : un dataset pour suivre des objets dans de longues vidéos.
― 9 min lire
Une nouvelle approche s'attaque à la segmentation d'actions dans de longues vidéos en utilisant le transport optimal.
― 8 min lire