Simple Science

La science de pointe expliquée simplement

# Informatique # Vision par ordinateur et reconnaissance des formes # Intelligence artificielle

Suivi des petits objets : Une nouvelle méthode

HGT-Track combine des caméras visibles et thermiques pour suivre efficacement les petits objets.

Qingyu Xu, Longguang Wang, Weidong Sheng, Yingqian Wang, Chao Xiao, Chao Ma, Wei An

― 5 min lire


Révolution du suivi des Révolution du suivi des petits objets thermiques pour un suivi inégalé. Combine des caméras visibles et
Table des matières

Suivre des petits objets, comme ceux qu'on voit dans les vidéos de drones ou de caméras de sécurité, c'est pas facile. Imagine essayer de repérer une petite voiture dans un parking bondé, surtout quand il fait noir et qu'il pleut. Dans ces conditions, beaucoup de méthodes de suivi ont du mal à suivre, surtout quand elles ne se basent que sur un type de caméra, comme une caméra normale ou une caméra thermique.

Cet article présente une nouvelle façon de suivre des petits objets en utilisant deux types de caméras ensemble : visible et thermique. On appelle notre méthode HGT-Track, qui utilise des techniques astucieuses pour combiner les forces des deux types de caméras.

Le Problème du Suivi des Petits Objets

Le suivi des petits objets fait face à plein de défis. Ces objets ont des caractéristiques faibles, ce qui les rend difficiles à voir. Quand on utilise seulement une caméra, on rate souvent des détails importants. Par exemple, si la visibilité est faible, certains objets peuvent ne pas être vus du tout par une caméra normale mais pourraient être captés par une caméra thermique.

Pour rendre les choses encore plus compliquées, il n'y a pas assez de jeux de données qui incluent des séquences de caméras des deux types avec des ID d'objets marqués, ce qui rend difficile la formation et le test des systèmes de suivi efficacement. Le manque de données de qualité combiné à la petite taille des cibles crée une tempête parfaite pour les difficultés de suivi.

La Solution : HGT-Track

HGT-Track propose une solution en utilisant deux types de caméras à la fois. En intégrant les informations des caméras visibles et thermiques, on peut repérer les petits objets de manière plus fiable.

Comment HGT-Track Fonctionne

HGT-Track utilise deux composants clés :

  1. Transformateur de Graphes Hétérogène : Ce terme un peu compliqué désigne une méthode d'analyse de différentes sortes de données (comme ce que nos caméras voient) et de déterminer comment elles sont liées. Il traite les objets et leur environnement comme un réseau, un peu comme une toile d'araignée, où chaque intersection (ou nœud) représente une information importante.

  2. Module de ReDétection (ReDet) : Parfois, nos caméras perdent de vue un objet. Le module ReDet aide à retrouver ces cibles manquantes en jetant un second coup d'œil avec l'autre type de caméra. Pense à ça comme l'avis d'un ami quand t'es pas sûr d'avoir vraiment vu ce que tu pensais.

Le Processus

HGT-Track traite les images des deux caméras en plusieurs étapes :

  1. Collecte de Données : D'abord, on capture les images à la fois visibles et thermiques.

  2. Intégration : Le système convertit ces images en un format qu'il peut comprendre.

  3. Construction du Graphe : Il construit un réseau qui représente les objets détectés et leurs relations.

  4. Intégration des Informations : Le Transformateur de Graphe Hétérogène prend le relais, reliant différents types de données pour une image plus claire.

  5. Détection et Suivi d'Objets : Avec toutes ces informations, notre méthode peut identifier et suivre les petits objets pendant qu'ils se déplacent à travers les images.

  6. ReDétection : Si un objet se perd, le système revient en arrière et vérifie à nouveau, cherchant dans les images de l'autre caméra.

Tester Notre Méthode

Pour voir si HGT-Track fonctionne vraiment, on l'a testé avec un ensemble de données récemment créé appelé VT-Tiny-MOT, contenant des vidéos d'objets petits capturés par des caméras visibles et thermiques.

Caractéristiques du Jeu de Données

Le jeu de données VT-Tiny-MOT inclut :

  • 115 paires de vidéos (une de chaque type de caméra).
  • Un total de 5208 instances cibles à travers différents scénarios incluant des bateaux, des piétons, des voitures, et plus encore.
  • Des annotations détaillées qui montrent où chaque objet apparaît dans les vidéos.

Résultats

Quand on a mis notre méthode en compétition avec d'autres, HGT-Track a mieux fonctionné pour suivre des petits objets avec précision, même dans des conditions difficiles. Il a réussi à suivre le rythme malgré les obstacles comme la faible lumière et les occlusions (quand des objets se cachent les uns les autres).

Travaux Connexes

Suivi Multi-Modal

Le suivi multimodal signifie utiliser différents types de sources de données (comme différentes caméras) pour améliorer la performance de suivi. Bien que beaucoup de méthodes aient exploré l'utilisation de divers types de données, la plupart se sont concentrées sur des cibles uniques et n'ont pas considéré la complexité de suivre plusieurs petits objets.

Suivi de Petits Objets

Suivre de petits objets, comme dans des situations militaires ou la surveillance de la faune, a toujours été compliqué. Beaucoup de chercheurs ont essayé différentes techniques, mais le manque de caractéristiques claires mène souvent à des scénarios difficiles que les méthodes existantes ont du mal à gérer.

Conclusion

HGT-Track présente une nouvelle méthode puissante pour suivre des petits objets en exploitant les forces des informations visibles et thermiques. Son design innovant de Transformateur de Graphe Hétérogène et ses capacités de redétection ouvrent un nouveau chemin pour un suivi efficace dans des environnements difficiles.

Fini le temps où on devait plisser les yeux sur nos écrans, espérant apercevoir la petite voiture ou l'oiseau insaisissable. Maintenant, on a un système qui nous aide à garder un œil sur eux, même quand ça se complique !

Source originale

Titre: Heterogeneous Graph Transformer for Multiple Tiny Object Tracking in RGB-T Videos

Résumé: Tracking multiple tiny objects is highly challenging due to their weak appearance and limited features. Existing multi-object tracking algorithms generally focus on single-modality scenes, and overlook the complementary characteristics of tiny objects captured by multiple remote sensors. To enhance tracking performance by integrating complementary information from multiple sources, we propose a novel framework called {HGT-Track (Heterogeneous Graph Transformer based Multi-Tiny-Object Tracking)}. Specifically, we first employ a Transformer-based encoder to embed images from different modalities. Subsequently, we utilize Heterogeneous Graph Transformer to aggregate spatial and temporal information from multiple modalities to generate detection and tracking features. Additionally, we introduce a target re-detection module (ReDet) to ensure tracklet continuity by maintaining consistency across different modalities. Furthermore, this paper introduces the first benchmark VT-Tiny-MOT (Visible-Thermal Tiny Multi-Object Tracking) for RGB-T fused multiple tiny object tracking. Extensive experiments are conducted on VT-Tiny-MOT, and the results have demonstrated the effectiveness of our method. Compared to other state-of-the-art methods, our method achieves better performance in terms of MOTA (Multiple-Object Tracking Accuracy) and ID-F1 score. The code and dataset will be made available at https://github.com/xuqingyu26/HGTMT.

Auteurs: Qingyu Xu, Longguang Wang, Weidong Sheng, Yingqian Wang, Chao Xiao, Chao Ma, Wei An

Dernière mise à jour: Dec 14, 2024

Langue: English

Source URL: https://arxiv.org/abs/2412.10861

Source PDF: https://arxiv.org/pdf/2412.10861

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires