Rastreando Objetos Pequeños: Un Nuevo Enfoque
HGT-Track combina cámaras visibles y térmicas para un seguimiento efectivo de objetos pequeños.
Qingyu Xu, Longguang Wang, Weidong Sheng, Yingqian Wang, Chao Xiao, Chao Ma, Wei An
― 5 minilectura
Tabla de contenidos
- El Problema con el Seguimiento de Objetos Pequeños
- La Solución: HGT-Track
- Cómo Funciona HGT-Track
- El Proceso
- Pruebas de Nuestro Método
- Características del Conjunto de Datos
- Resultados
- Trabajo Relacionado
- Seguimiento Multi-modal
- Seguimiento de Objetos Pequeños
- Conclusión
- Fuente original
- Enlaces de referencia
Seguir objetos diminutos, como los que se ven en videos de drones o cámaras de seguridad, no es fácil. Imagina intentar encontrar un auto chiquito en un estacionamiento abarrotado, especialmente en un día oscuro y lluvioso. En esas condiciones, muchos métodos de seguimiento ya existentes tienen problemas, sobre todo si dependen de un solo tipo de cámara, como una cámara normal o una cámara térmica.
Este artículo presenta una nueva forma de rastrear objetos pequeños usando dos tipos de cámaras juntas: visible y térmica. Llamamos a nuestro método HGT-Track, que utiliza técnicas ingeniosas para combinar las fortalezas de ambos tipos de cámaras.
El Problema con el Seguimiento de Objetos Pequeños
El seguimiento de objetos diminutos enfrenta muchos desafíos. Estos objetos tienen características débiles, lo que los hace difíciles de ver. Cuando solo usamos una cámara, a menudo nos perdemos detalles críticos. Por ejemplo, si la visibilidad es baja, algunos objetos podrían no ser vistos por una cámara normal, pero aún podrían ser captados por una cámara térmica.
Para empeorar las cosas, no hay suficientes conjuntos de datos que incluyan grabaciones de ambos tipos de cámara con IDs de objetos marcados, lo que complica el entrenamiento y las pruebas de los sistemas de seguimiento. La falta de datos de calidad combinada con el tamaño diminuto de los objetivos crea una tormenta perfecta para las dificultades de seguimiento.
La Solución: HGT-Track
HGT-Track ofrece una solución al usar dos tipos de cámaras a la vez. Al integrar información de ambas cámaras, podemos identificar objetos pequeños de manera más confiable.
Cómo Funciona HGT-Track
HGT-Track utiliza dos componentes clave:
-
Transformador de Grafo Heterogéneo: Este término elegante se refiere a un método para analizar diferentes tipos de datos (como lo que ven nuestras cámaras) y entender cómo se relacionan entre sí. Trata a los objetos y su entorno como una red, parecido a una telaraña, donde cada intersección (o nodo) representa información importante.
-
Módulo de Redetección (ReDet): A veces, nuestras cámaras pierden el rastro de un objeto. El módulo ReDet ayuda a encontrar estos objetivos perdidos otra vez al echar un segundo vistazo usando el otro tipo de cámara. Piensa en ello como la segunda opinión de un amigo cuando no estás seguro si realmente viste lo que creías.
El Proceso
HGT-Track procesa imágenes de ambas cámaras en varios pasos:
-
Recolección de Datos: Primero, se capturan imágenes visibles y térmicas.
-
Incorporación: El sistema convierte estas imágenes a un formato que puede entender.
-
Construcción de Grafo: Se crea una red que representa los objetos detectados y sus relaciones.
-
Integración de Información: El Transformador de Grafo Heterogéneo toma el control, conectando diferentes tipos de datos para una imagen más clara.
-
Detección y Seguimiento de Objetos: Con toda esta información, nuestro método puede identificar y seguir objetos pequeños a medida que se mueven entre los fotogramas.
-
Redetección: Si un objeto se pierde, el sistema vuelve a chequear, buscando en el material de la otra cámara.
Pruebas de Nuestro Método
Para ver si HGT-Track realmente funciona, lo pusimos a prueba usando un conjunto de datos recién creado llamado VT-Tiny-MOT, que consiste en videos con objetos pequeños capturados por cámaras visibles y térmicas.
Características del Conjunto de Datos
El conjunto de datos VT-Tiny-MOT incluye:
- 115 pares de videos (uno de cada tipo de cámara).
- Un total de 5208 instancias de objetivos en varios escenarios que incluyen barcos, peatones, autos y más.
- Anotaciones elaboradas que destacan dónde aparece cada objeto en el metraje.
Resultados
Cuando pusimos nuestro método a la par con otros, HGT-Track tuvo mejor desempeño en el seguimiento preciso de objetos pequeños, incluso en condiciones difíciles. Logró mantenerse al día a pesar de obstáculos como baja iluminación y oclusiones (cuando un objeto bloquea a otro).
Trabajo Relacionado
Seguimiento Multi-modal
El seguimiento multi-modal significa usar diferentes tipos de fuentes de datos (como diferentes cámaras) para mejorar el rendimiento del seguimiento. Mientras que muchos métodos han explorado el uso de varios tipos de datos, la mayoría se han centrado en objetivos individuales y no han considerado las complejidades de rastrear múltiples objetos pequeños.
Seguimiento de Objetos Pequeños
Rastrear objetos pequeños, como en situaciones militares o monitoreo de vida silvestre, siempre ha sido complicado. Muchos investigadores han probado varias técnicas, pero la falta de características claras a menudo lleva a enfrentar escenarios difíciles que los métodos existentes no pueden manejar.
Conclusión
HGT-Track presenta un nuevo método potente para seguir objetos diminutos aprovechando las fortalezas de la información visible y térmica. Su diseño innovador de Transformador de Grafo Heterogéneo y sus capacidades de redetección abren un nuevo camino para el seguimiento efectivo en entornos desafiantes.
¡Ya no tenemos que entrecerrar los ojos en nuestras pantallas, esperando ver el escurridizo auto o pájaro pequeño! Ahora tenemos un sistema que nos ayuda a mantener el seguimiento, incluso cuando las cosas se complican.
Título: Heterogeneous Graph Transformer for Multiple Tiny Object Tracking in RGB-T Videos
Resumen: Tracking multiple tiny objects is highly challenging due to their weak appearance and limited features. Existing multi-object tracking algorithms generally focus on single-modality scenes, and overlook the complementary characteristics of tiny objects captured by multiple remote sensors. To enhance tracking performance by integrating complementary information from multiple sources, we propose a novel framework called {HGT-Track (Heterogeneous Graph Transformer based Multi-Tiny-Object Tracking)}. Specifically, we first employ a Transformer-based encoder to embed images from different modalities. Subsequently, we utilize Heterogeneous Graph Transformer to aggregate spatial and temporal information from multiple modalities to generate detection and tracking features. Additionally, we introduce a target re-detection module (ReDet) to ensure tracklet continuity by maintaining consistency across different modalities. Furthermore, this paper introduces the first benchmark VT-Tiny-MOT (Visible-Thermal Tiny Multi-Object Tracking) for RGB-T fused multiple tiny object tracking. Extensive experiments are conducted on VT-Tiny-MOT, and the results have demonstrated the effectiveness of our method. Compared to other state-of-the-art methods, our method achieves better performance in terms of MOTA (Multiple-Object Tracking Accuracy) and ID-F1 score. The code and dataset will be made available at https://github.com/xuqingyu26/HGTMT.
Autores: Qingyu Xu, Longguang Wang, Weidong Sheng, Yingqian Wang, Chao Xiao, Chao Ma, Wei An
Última actualización: Dec 14, 2024
Idioma: English
Fuente URL: https://arxiv.org/abs/2412.10861
Fuente PDF: https://arxiv.org/pdf/2412.10861
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.