Derniers articles pour Analyse de vidéo

Vision par ordinateur et reconnaissance des formes Avancées dans les systèmes d'assistance médicale automatisée

Utiliser la technologie pour améliorer les procédures médicales d'urgence et soutenir les intervenants.

2025-07-10T18:02:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer l'apprentissage contrastif vidéo avec BOLD-DI

Une nouvelle méthode améliore la compréhension des vidéos en séparant les caractéristiques dynamiques et statiques.

2025-07-10T01:50:36+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes WTS Dataset : Un nouveau focus sur le comportement piéton

Un ensemble de données qui donne des aperçus sur les interactions des piétons dans des situations de circulation.

2025-07-09T15:50:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Nouveau benchmark améliore la compréhension vidéo-langue

Un nouveau repère améliore la compréhension des modèles sur les longues vidéos et le langage.

2025-07-09T01:29:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Segmentation des actions animales dans l'analyse vidéo

Un aperçu de comment la segmentation d'action améliore notre compréhension des comportements animaux.

2025-07-05T22:49:45+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la compréhension vidéo avec Ego-VPA

Ego-VPA simplifie l'adaptation pour l'analyse vidéo égocentrique, améliorant l'efficacité et la performance.

2025-07-05T21:54:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes SANGRIA : Une nouvelle méthode pour l'analyse vidéo chirurgicale

SANGRIA améliore l'analyse vidéo chirurgicale en utilisant des graphes de scènes dynamiques et des annotations minimales.

2025-07-05T15:51:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la détection d'action vidéo grâce à la prise en compte du contexte

Cette étude améliore la détection d'actions vidéo en se concentrant sur le contexte et la classification.

2025-07-05T06:46:00+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Améliorer le suivi des points grâce aux caractéristiques linguistiques

Une nouvelle méthode améliore le suivi des points en liant le langage avec des données visuelles.

2025-07-04T21:01:24+00:00 ― 7 min lire

Traitement de l'image et de la vidéo SAM-2 : Avancées dans la segmentation vidéo chirurgicale

SAM-2 améliore l'analyse vidéo chirurgicale, gérant des défis comme la fumée et un éclairage faible.

2025-07-04T09:46:15+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Un nouveau modèle pour l'analyse d'objets vidéo

Ce modèle prédit le mouvement des objets et analyse le contenu vidéo de manière efficace.

2025-07-03T11:42:42+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Découvrez SynopGround : Une nouvelle approche du video grounding

Un nouveau jeu de données et une méthode améliorent le grounding vidéo pour des récits complexes.

2025-07-02T17:08:48+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Framework YOWOv3 : Un bond en avant dans la détection d'actions

YOWOv3 améliore la détection d'action dans les vidéos avec efficacité et précision.

2025-07-02T03:50:54+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Nouveau dataset pour améliorer l'analyse des vidéos de cuisine

COM Kitchens propose des vidéos de cuisine non montées pour étudier les processus de préparation des aliments.

2025-07-01T20:28:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la localisation d'actions temporelles en ligne

MATR améliore la détection d'actions dans des vidéos non montées grâce à une technologie augmentée par la mémoire.

2025-07-01T08:13:48+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les modèles de langage multimodaux énormes

mPLUG-Owl3 améliore la compréhension des images et des vidéos pour des réponses plus efficaces.

2025-06-30T17:13:12+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancer la détection d'action dans les flux vidéo

Une nouvelle méthode améliore la classification des actions en utilisant le contexte historique dans les vidéos.

2025-06-29T04:44:54+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Une nouvelle approche pour la localisation d'actions dans les vidéos

Ce cadre améliore la localisation d'actions dans les vidéos en utilisant une représentation probabiliste et le contexte.

2025-06-28T20:27:12+00:00 ― 7 min lire

Multimédia Analyser l'actualité mondiale à travers le contenu vidéo

Une méthode pour résumer des vidéos de différentes cultures et sources d'info.

2025-06-28T03:36:00+00:00 ― 6 min lire

Multimédia Repenser les benchmarks de localisation de sources audio-visuelles

Les benchmarks actuels sous-estiment la capacité des modèles à relier les données audio et visuelles.

2025-06-25T16:03:10+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancer le suivi d'objets dans les vidéos égocentriques

Une nouvelle méthode améliore le suivi d'objets dans des vidéos à la première personne en utilisant une conscience 3D.

2025-06-25T15:41:30+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans les techniques de segmentation vidéo

De nouvelles méthodes améliorent la précision et l'efficacité de la segmentation vidéo pour diverses applications.

2025-06-24T21:23:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection d'actions temporelles grâce à un pré-entraînement à long terme

De nouvelles méthodes améliorent la détection d'action dans les vidéos grâce à des techniques de formation innovantes.

2025-06-23T06:17:06+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le suivi de point avec des modèles de base

Examiner le pouvoir des modèles de fond dans les tâches de suivi de point efficaces.

2025-06-22T19:13:30+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans le ancrage temporel vidéo sans entraînement

Une nouvelle méthode localise des événements vidéo en utilisant de grands modèles pré-entraînés sans formation spécifique.

2025-06-21T04:30:54+00:00 ― 10 min lire

Vision par ordinateur et reconnaissance des formes Améliorer la reconnaissance d'actions dans les vidéos en utilisant des infos de profondeur

Cette étude améliore la reconnaissance d'action en fusionnant des cartes de profondeur avec des images vidéo RGB.

2025-06-20T17:35:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Présentation de ConsistencyTrack : Une nouvelle approche pour le suivi multi-objets

ConsistencyTrack améliore le suivi des objets dans les vidéos en utilisant des techniques innovantes de gestion du bruit.

2025-06-20T14:41:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes S'attaquer à l'effondrement de l'attention dans la détection d'actions temporelles

Une nouvelle approche améliore la détection d'actions dans les vidéos en s'attaquant à l'effondrement de l'attention.

2025-06-20T08:14:18+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Nouveaux trucs pour détecter les vidéos deepfake

Des techniques innovantes améliorent la détection des vidéos deepfake avec l'évolution de la technologie.

2025-06-19T11:10:18+00:00 ― 5 min lire

Vision par ordinateur et reconnaissance des formes FinePseudo : Une nouvelle approche de la reconnaissance d'action

FinePseudo améliore la reconnaissance d'actions fine avec moins d'exemples étiquetés.

2025-06-18T14:45:48+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes ViDiDi : Une nouvelle approche de la compréhension vidéo

ViDiDi améliore l'apprentissage vidéo en utilisant efficacement des données non étiquetées.

2025-06-18T02:39:00+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes Suivi de points en temps réel avec une seule caméra

Une nouvelle méthode améliore le suivi des objets dans les vidéos avec juste une caméra.

2025-06-17T23:13:36+00:00 ― 9 min lire

Vision par ordinateur et reconnaissance des formes MADiff : Améliorer la prédiction des mouvements de main dans les vidéos

Une nouvelle méthode améliore les prédictions des mouvements de main dans les vidéos pour les robots et la réalité virtuelle.

2025-06-17T03:52:18+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Utiliser des images statiques pour former des modèles vidéo

Ce cadre utilise des images statiques pour créer un entraînement de modèle vidéo efficace.

2025-06-14T09:54:24+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Améliorer le suivi des mouvements humains avec de nouvelles techniques

Une nouvelle méthode améliore la précision du suivi des mouvements humains à partir de vidéos.

2025-06-14T09:46:30+00:00 ― 6 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans l'analyse vidéo du foot 2024

Les défis de SoccerNet 2024 poussent à innover dans la compréhension vidéo du foot.

2025-06-11T10:40:30+00:00 ― 6 min lire

Apprentissage automatique Nouveau cadre pour l'apprentissage causal dans les séries temporelles

Une nouvelle approche pour comprendre les relations variables dans des environnements changeants.

2025-06-10T00:38:16+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer l'IA dans la reconnaissance des actions vidéo

La recherche se concentre sur l'amélioration de la capacité de l'IA à reconnaître des actions dans les vidéos.

2025-06-09T14:18:12+00:00 ― 7 min lire

Vision par ordinateur et reconnaissance des formes Avancées dans la détection des relations visuelles en vidéo

Un nouveau cadre améliore la détection des relations entre objets dans les vidéos, rendant ça plus précis et adaptable.

2025-06-09T05:44:42+00:00 ― 8 min lire

Vision par ordinateur et reconnaissance des formes Faire avancer la réponse vidéo à des questions avec du texte ancré

Une nouvelle méthode améliore la réponse aux questions vidéo grâce à la reconnaissance de texte dans les scènes.

2025-06-07T23:04:00+00:00 ― 9 min lire