EgoObjects offre un énorme ensemble de données pour comprendre les objets d'un point de vue à la première personne.
― 9 min lire
La science de pointe expliquée simplement
EgoObjects offre un énorme ensemble de données pour comprendre les objets d'un point de vue à la première personne.
― 9 min lire
Une nouvelle méthode combine la prédiction de saillance vidéo et la détection, ce qui améliore les performances.
― 8 min lire
Cette étude présente une méthode pour classifier des vidéos grâce à des descriptions textuelles riches.
― 7 min lire
Une nouvelle méthode améliore la façon dont la tech détecte le comportement humain dans des groupes.
― 6 min lire
MoDA améliore la segmentation sémantique dans les vidéos en utilisant les infos de mouvement.
― 7 min lire
ProtoExplorer aide les experts en criminalistique à analyser efficacement les vidéos deepfake.
― 10 min lire
Cet article explique comment utiliser des réseaux de neurones pour la reconnaissance de scènes dans des films et des séries.
― 8 min lire
Une nouvelle méthode améliore la détection des anomalies de circulation dans les vidéos de conduite pour la sécurité.
― 6 min lire
Nouveau modèle améliore le suivi et la reconnaissance de texte dans le contenu vidéo.
― 5 min lire
Une nouvelle méthode pour gérer efficacement des données complexes dépendant du temps.
― 6 min lire
De nouvelles méthodes aident les robots à apprendre des compétences efficacement en regardant des vidéos d'experts.
― 10 min lire
Présentation de PRTreID, une méthode unifiée pour suivre et identifier les joueurs dans les vidéos de sports.
― 6 min lire
Cette étude explore comment les machines relient les actions à leurs résultats grâce à l'analyse vidéo.
― 9 min lire
Un cadre pour rendre les prédictions vidéo compréhensibles et fiables.
― 7 min lire
FineBio propose un ensemble de données pour suivre les actions dans les expériences biologiques via vidéo.
― 8 min lire
M-RAAP optimise l'association des données vidéo et texte pour de meilleurs résultats de recherche.
― 7 min lire
Une nouvelle méthode améliore la segmentation audio-visuelle sans étiquettes détaillées.
― 7 min lire
Un nouveau jeu de données améliore la capacité de l'IA à interpréter le comportement humain dans les vidéos.
― 9 min lire
Un ensemble de données pour évaluer les difficultés lors des tâches d'assemblage en utilisant des annotations vidéo.
― 10 min lire
UniVS simplifie les tâches de segmentation vidéo en utilisant des invites pour de meilleures performances et polyvalence.
― 8 min lire
TV-TREES améliore la réponse aux questions vidéo avec des structures de raisonnement claires.
― 6 min lire
Cette recherche examine le passage des actions intentionnelles aux actions non intentionnelles dans les vidéos.
― 5 min lire
Un nouveau système identifie les actions des élèves dans les vidéos de classe avec une grande efficacité.
― 7 min lire
Une nouvelle méthode améliore la détection des relations dans les vidéos en utilisant des modèles spécialisés.
― 10 min lire
Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.
― 8 min lire
Une approche innovante pour reconnaître et localiser les comportements de conduite distraits.
― 12 min lire
Une nouvelle méthode améliore la réponse aux questions vidéo tout en gardant les connaissances antérieures.
― 8 min lire
Mamba montre un fort potentiel dans l'analyse vidéo par rapport aux transformateurs.
― 8 min lire
HawkEye améliore les modèles vidéo-texte pour traiter les vidéos plus longues efficacement.
― 7 min lire
Une nouvelle approche simplifie le grounding vidéo en éliminant le besoin d'étiquettes temporelles précises.
― 9 min lire
DINO Tracker améliore le suivi des points vidéo, gérant les occlusions de manière efficace.
― 9 min lire
Une nouvelle méthode améliore l'identification des événements inhabituels dans les vidéos.
― 10 min lire
Apprends comment la taille des patchs augmente l'efficacité des modèles d'apprentissage profond.
― 5 min lire
Une nouvelle approche utilise des modèles de langage pour une analyse efficace de vidéos longues.
― 7 min lire
Une nouvelle méthode améliore la reconnaissance d'actions dans des vidéos non montées en utilisant peu d'exemples.
― 11 min lire
Annolid automatise le suivi des animaux dans les vidéos, aidant les chercheurs à étudier leur comportement.
― 6 min lire
De nouvelles méthodes améliorent la détection d'action vidéo face à diverses corruptions.
― 7 min lire
Le modèle ASTRA améliore la précision dans l'identification des actions pendant les matchs de foot.
― 8 min lire
DIBS améliore le sous-titrage des événements vidéo en affinant les limites avec des données non étiquetées.
― 10 min lire
Une nouvelle méthode pour identifier et décrire des objets dans des vidéos.
― 8 min lire