Derniers articles pour Analyse de vidéo

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation des actions dans de longues vidéos

Une nouvelle approche s'attaque à la segmentation d'actions dans de longues vidéos en utilisant le transport optimal.

2025-08-13T21:26:15+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la mesure de la fréquence cardiaque à partir de vidéos compressées

Une nouvelle méthode améliore la précision de la mesure du rythme cardiaque dans les vidéos compressées.

2025-08-13T19:09:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Comprendre les parcours de scan : l'importance des motifs de regard individuels

Cette étude montre comment les schémas de regard personnels influencent les interactions humain-robot.

2025-08-13T16:15:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Comprendre les modèles de fondation vidéo

Une plongée profonde dans les modèles de fondation vidéo et leur importance dans l'analyse vidéo.

2025-08-13T13:06:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Détection de mouvement en temps réel avec DMD

Découvrez comment le DMD améliore la détection de mouvement dans les flux vidéo pour les applications de sécurité.

2025-08-12T15:46:30+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Présentation de CinePile : Un nouveau standard dans la compréhension vidéo

CinePile défie la compréhension des vidéos longues avec 305 000 questions variées.

2025-08-11T01:11:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de BIMM : Une nouvelle façon pour les ordinateurs d'apprendre des vidéos

BIMM apprend le contenu vidéo en imitant les chemins neuronaux du cerveau humain.

2025-08-09T11:40:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes JOSENet : Un nouveau système pour détecter la violence dans les vidéos

JOSENet améliore la détection en temps réel de la violence dans les vidéos de surveillance en utilisant des méthodes avancées.

2025-08-07T22:55:35+00:00 ― 9 min lire

Analyse numérique Estimation de mouvement efficace en utilisant des grilles adaptatives

Une nouvelle méthode améliore l'estimation de mouvement en utilisant des maillages finis adaptatifs.

2025-08-07T01:30:03+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la reconnaissance d'actions grâce aux caméras portables

Une étude sur la reconnaissance des actions en utilisant l'apprentissage avec peu d'exemples et des données multimodales.

2025-08-04T06:51:06+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la réponse aux questions vidéo grâce à des propriétés dynamiques

De nouvelles méthodes améliorent la compréhension par les machines des interactions dynamiques dans le contenu vidéo.

2025-08-03T10:02:54+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Nouveau Benchmark MLVU s'attaque à la compréhension des longues vidéos

Le benchmark MLVU vise à améliorer la compréhension des vidéos longues par les machines.

2025-08-01T11:57:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection d'actions dans les vidéos avec des transformers

Une nouvelle méthode améliore la précision de détection des actions dans des scènes vidéo qui se chevauchent.

2025-07-30T21:23:12+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la segmentation d'objets vidéo avec des banques de mémoire restreintes

Une nouvelle approche pour la segmentation d'objets vidéo améliore la précision en limitant l'utilisation de la mémoire.

2025-07-29T23:47:36+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Évaluation de la compréhension vidéo dans les modèles de langage multimodaux

Un nouveau standard vise à évaluer les MLLMs dans la compréhension vidéo sur plusieurs sujets.

2025-07-29T22:20:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la technologie de compréhension vidéo

Un nouveau modèle améliore la compréhension vidéo en fusionnant des encodeurs d'images et de vidéos.

2025-07-29T12:28:12+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer à la montée des anomalies vidéo générées par l'IA

VANE-Bench améliore la détection des anomalies dans les vidéos malgré la montée du contenu AI.

2025-07-28T23:41:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation du jeu de données de courts métrages pour la compréhension vidéo

Un nouveau jeu de données pour améliorer la compréhension des récits dans les courts-métrages.

2025-07-28T23:10:18+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Nouveau standard pour les modèles vidéo-langage

Un nouveau benchmark vise la compositionnalité dans la compréhension vidéo et les modèles de langage.

2025-07-28T04:52:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Un nouveau cadre pour la classification vidéo en temps réel

Présentation d'une méthode pour des classifications vidéo rapides basées sur l'analyse des premières images.

2025-07-27T15:42:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de VideoVista : Une nouvelle référence pour le QA vidéo

VideoVista propose une évaluation complète pour les modèles de question-réponse vidéo.

2025-07-27T13:35:48+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'actions temporelles à vocabulaire ouvert

Une nouvelle méthode améliore la reconnaissance des actions dans les vidéos en utilisant le langage contextuel.

2025-07-25T21:50:00+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Intégrer des connaissances du domaine pour une meilleure prédiction vidéo

Une nouvelle approche améliore la prédiction des images vidéo en utilisant des connaissances du domaine.

2025-07-23T18:29:00+00:00 ― 8 min lire

Traitement de l'audio et de la parole Avancées dans la reconnaissance vocale audio-visuelle

Les recherches montrent que la vidéo aide à améliorer la reconnaissance vocale dans des environnements bruyants.

2025-07-22T20:41:20+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes DeepMoveSORT : Progrès dans le suivi d'objets

DeepMoveSORT améliore l'efficacité du suivi d'objets, surtout dans des scénarios de mouvement complexes.

2025-07-22T04:33:48+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes KeyVideoLLM : Améliorer la gestion des données vidéo

Une nouvelle méthode améliore la gestion des données vidéo pour une meilleure compréhension et efficacité.

2025-07-20T06:52:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Système multi-agents dynamique pour répondre à des questions sur des vidéos

Une nouvelle méthode améliore la précision pour répondre aux questions basées sur des vidéos.

2025-07-19T22:19:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Progrès dans le suivi multi-objets avec une mémoire intelligente

Une nouvelle méthode améliore le suivi des objets en gérant la mémoire de manière efficace.

2025-07-18T11:49:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes FeatureSORT : Avancées dans le suivi multi-objets

FeatureSORT améliore la précision de suivi et la flexibilité dans des environnements dynamiques.

2025-07-18T09:42:48+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes VideoEval : Une nouvelle norme pour l'évaluation des modèles vidéo

VideoEval établit une nouvelle référence pour évaluer efficacement les modèles de base vidéo.

2025-07-17T18:26:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la compréhension vidéo avec l'auto-formation

Une nouvelle méthode améliore la compréhension du contenu vidéo par l'IA.

2025-07-17T12:15:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'objets vidéo avec TrCAM-V

TrCAM-V propose une nouvelle façon de localiser des objets dans des vidéos avec un minimum d'infos.

2025-07-17T08:41:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la segmentation d'objets vidéo

Une nouvelle méthode améliore la segmentation d'objets dans les vidéos avec des données faiblement étiquetées.

2025-07-17T06:03:48+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la localisation d'actions temporelles avec un auto-apprentissage

Utiliser des vidéos non étiquetées pour améliorer la reconnaissance d'actions dans des vidéos longues.

2025-07-16T17:01:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Reconstituer des scènes de crime avec des champs de radiance neuronaux

Utiliser la technologie NeRF pour recréer des scènes de crime à partir de vidéos.

2025-07-15T08:30:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Segmentation audio-visuelle référente : Une nouvelle approche

Combiner des infos audio et visuelles aide à mieux reconnaître les objets dans les vidéos.

2025-07-13T10:17:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Évaluation des modèles vidéo-texte : une nouvelle approche

Cette étude propose une nouvelle méthode d'évaluation pour la compréhension vidéo-texte.

2025-07-12T01:06:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes ActionSwitch : Une nouvelle approche pour la détection d'actions en temps réel

ActionSwitch détecte des actions dans des vidéos en streaming sans avoir besoin d'infos de classe au préalable.

2025-07-11T23:31:54+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes Présentation de LookupViT : Une nouvelle méthode pour le traitement visuel

LookupViT améliore les tâches de reconnaissance visuelle grâce à un traitement efficace des tokens.

2025-07-11T20:53:54+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Nouvelle méthodologie pour comprendre les longues vidéos

Une nouvelle approche améliore la compréhension des vidéos longues, en s'attaquant à des défis clés.

2025-07-11T19:42:48+00:00 ― 7 min lire