Derniers articles pour Analyse de vidéo

Vision par ordinateur et reconnaissance des formes Lier les actions et les effets dans la compréhension vidéo

Cette étude explore comment les machines relient les actions à leurs résultats grâce à l'analyse vidéo.

2025-09-15T21:38:18+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Expliquer les prédictions vidéo : une nouvelle approche

Un cadre pour rendre les prédictions vidéo compréhensibles et fiables.

2025-09-15T05:42:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes FineBio : Un Nouvel Ensemble de Données pour l'Analyse d'Expériences Biologiques

FineBio propose un ensemble de données pour suivre les actions dans les expériences biologiques via vidéo.

2025-09-13T01:49:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes M-RAAP : Faire avancer la récupération vidéo-texte

M-RAAP optimise l'association des données vidéo et texte pour de meilleurs résultats de recherche.

2025-09-12T20:57:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de segmentation audio-visuelle

Une nouvelle méthode améliore la segmentation audio-visuelle sans étiquettes détaillées.

2025-09-12T20:28:15+00:00 ― 7 min lire

Multimédia BDIQA : Faire avancer la réponse aux questions vidéo avec la théorie de l'esprit

Un nouveau jeu de données améliore la capacité de l'IA à interpréter le comportement humain dans les vidéos.

2025-09-09T07:30:24+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Analyser les galères dans les tâches d'assemblage à travers des vidéos

Un ensemble de données pour évaluer les difficultés lors des tâches d'assemblage en utilisant des annotations vidéo.

2025-09-07T12:03:24+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes UniVS : Une approche unifiée pour la segmentation vidéo

UniVS simplifie les tâches de segmentation vidéo en utilisant des invites pour de meilleures performances et polyvalence.

2025-09-03T02:59:12+00:00 ― 8 min lire

Calcul et langage Présentation de TV-TREES : Une nouvelle approche du VideoQA

TV-TREES améliore la réponse aux questions vidéo avec des structures de raisonnement claires.

2025-09-02T23:41:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Analyser les activités non intentionnelles dans les vidéos

Cette recherche examine le passage des actions intentionnelles aux actions non intentionnelles dans les vidéos.

2025-09-02T22:30:36+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Détection d'activité efficace dans les vidéos de classe

Un nouveau système identifie les actions des élèves dans les vidéos de classe avec une grande efficacité.

2025-09-02T05:15:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancer la détection de relation vidéo avec MoE-VRD

Une nouvelle méthode améliore la détection des relations dans les vidéos en utilisant des modèles spécialisés.

2025-08-31T23:30:18+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Détecter l'humour dans les vidéos avec FunnyNet-W

Un nouveau modèle identifie des moments drôles dans les vidéos en utilisant des données visuelles, audio et textuelles.

2025-08-30T23:09:25+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la sécurité des conducteurs grâce à la reconnaissance d'actions

Une approche innovante pour reconnaître et localiser les comportements de conduite distraits.

2025-08-30T11:49:24+00:00 ― 12 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de questions-réponses vidéo

Une nouvelle méthode améliore la réponse aux questions vidéo tout en gardant les connaissances antérieures.

2025-08-29T20:17:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Mamba : Un nouveau joueur dans la compréhension vidéo

Mamba montre un fort potentiel dans l'analyse vidéo par rapport aux transformateurs.

2025-08-29T12:39:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes HawkEye : Un nouveau modèle pour comprendre les vidéos longues

HawkEye améliore les modèles vidéo-texte pour traiter les vidéos plus longues efficacement.

2025-08-28T23:52:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer le ancrage vidéo par paragraphe sans étiquettes temporelles

Une nouvelle approche simplifie le grounding vidéo en éliminant le besoin d'étiquettes temporelles précises.

2025-08-28T03:36:06+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes DINO Tracker : Un Pas En Avant Dans le Suivi de Points Vidéo

DINO Tracker améliore le suivi des points vidéo, gérant les occlusions de manière efficace.

2025-08-27T04:33:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de détection d'anomalies vidéo

Une nouvelle méthode améliore l'identification des événements inhabituels dans les vidéos.

2025-08-27T04:02:00+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Rendre l'apprentissage profond plus efficace avec le découpage de patchs

Apprends comment la taille des patchs augmente l'efficacité des modèles d'apprentissage profond.

2025-08-26T05:39:00+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle méthode améliore le question-réponse vidéo

Une nouvelle approche utilise des modèles de langage pour une analyse efficace de vidéos longues.

2025-08-26T00:30:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'actions vidéo à quelques exemples

Une nouvelle méthode améliore la reconnaissance d'actions dans des vidéos non montées en utilisant peu d'exemples.

2025-08-25T04:14:18+00:00 ― 11 min lire

Vision par ordinateur et reconnaissance des formes Annolid : Transformer le suivi des animaux dans la recherche

Annolid automatise le suivi des animaux dans les vidéos, aidant les chercheurs à étudier leur comportement.

2025-08-25T02:23:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la robustesse de la détection d'actions temporales

De nouvelles méthodes améliorent la détection d'action vidéo face à diverses corruptions.

2025-08-24T07:26:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection d'actions pour les vidéos de foot

Le modèle ASTRA améliore la précision dans l'identification des actions pendant les matchs de foot.

2025-08-23T06:09:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le sous-titrage vidéo dense avec le cadre DIBS

DIBS améliore le sous-titrage des événements vidéo en affinant les limites avec des données non étiquetées.

2025-08-22T21:35:48+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la segmentation d'instances vidéo en monde ouvert

Une nouvelle méthode pour identifier et décrire des objets dans des vidéos.

2025-08-22T14:45:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le suivi de mouvement 3D pour les vidéos

Une nouvelle approche 3D améliore la précision du suivi de mouvement dans les vidéos.

2025-08-22T06:35:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouveau jeu de données SportsHHI améliore l'analyse de l'interaction des sports d'équipe

SportsHHI se concentre sur les interactions humaines dans les vidéos de basket et de volley pour une analyse améliorée.

2025-08-21T20:58:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la mesure du rythme cardiaque avec la vidéo

Une nouvelle méthode améliore la mesure de la fréquence cardiaque en utilisant l'analyse vidéo et la modélisation faciale en 3D.

2025-08-19T22:06:06+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'apprentissage du mouvement humain à partir de vidéos

Un nouveau système améliore la capture de mouvement 3D à partir de vidéos en 2D.

2025-08-19T10:07:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Annotation vidéo efficace avec la technologie SPAM

SPAM propose une manière plus intelligente de taguer les données vidéo efficacement.

2025-08-18T18:03:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation d'objets en mouvement avec SAM et le flux optique

Cette étude améliore la segmentation des objets en mouvement en utilisant SAM combiné avec des techniques de flux optique.

2025-08-18T12:15:48+00:00 ― 9 min lire

Multimédia Pegasus-1 : Un nouveau modèle pour la compréhension vidéo

Pegasus-1 permet aux utilisateurs d'interagir avec des vidéos en utilisant un langage naturel.

2025-08-17T17:10:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Présentation de MovieChat : Une nouvelle façon d'analyser de longues vidéos

MovieChat simplifie la compréhension des vidéos longues en utilisant des techniques de gestion de mémoire efficaces.

2025-08-16T02:04:00+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Compter les actions dans les vidéos avec ESCounts

Une nouvelle méthode améliore comment on compte les actions dans les vidéos en utilisant des exemples.

2025-08-15T07:26:45+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans la recherche sur les anomalies vidéo

De nouvelles méthodes améliorent la compréhension et l'analyse des événements inhabituels dans les vidéos.

2025-08-15T06:42:42+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la segmentation d'objets vidéo à long terme

Présentation de LVOS : un dataset pour suivre des objets dans de longues vidéos.

2025-08-15T03:01:30+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation des actions dans de longues vidéos

Une nouvelle approche s'attaque à la segmentation d'actions dans de longues vidéos en utilisant le transport optimal.

2025-08-13T21:26:15+00:00 ― 8 min lire