Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones

Desafíos y soluciones en el seguimiento de múltiples objetos

Avances tecnológicos en el seguimiento de múltiples objetos en dispositivos pequeños.

Xiang Li, Cheng Chen, Yuan-yao Lou, Mustafa Abdallah, Kwang Taik Kim, Saurabh Bagchi

― 7 minilectura


Avanzando en laAvanzando en latecnología de seguimientode múltiples objetosdispositivos pequeños.seguimiento en tiempo real enSoluciones innovadoras para el
Tabla de contenidos

En el mundo de los videos e imágenes, rastrear múltiples objetos puede ser un trabajo complicado, especialmente cuando quieres que sea rápido y preciso. Imagina una calle llena de coches, bicicletas y peatones moviéndose por todas partes. Mantener el control de quién es quién en esta escena bulliciosa puede parecer que estás tratando de pastorear gatos. Es un trabajo para la tecnología y un sistema inteligente que lo haga en tiempo real, porque ¿quién quiere esperar actualizaciones?

Ahí es donde entra en juego el rastreo de múltiples objetos (MOT). Esta tecnología busca reconocer y seguir varios objetos en una secuencia de cuadros de video mientras mantiene claras sus identidades. Piénsalo como un juego de etiqueta muy inteligente donde el objetivo es recordar quién es "el que toca" mientras todos están corriendo. Sin embargo, hacer esto en dispositivos pequeños, como esos gadgets que tenemos que caben en nuestros bolsillos, trae sus propios desafíos.

Los Desafíos del Rastreo

Bajo Poder de Cómputo

Primero que nada, muchos dispositivos integrados simplemente no tienen la potencia de esos grandes y lujosos ordenadores que podrías ver en laboratorios de tecnología. Imagina correr un maratón con pesas atadas a las piernas-esas pesas son como los límites de la capacidad de cómputo de un dispositivo. Aunque algunos dispositivos se están volviendo más poderosos, todavía hay una brecha entre lo que pueden manejar y lo que se necesita para un rastreo efectivo.

Por ejemplo, al usar un sistema de detección conocido como YOLOX, una configuración de alto rendimiento en un ordenador robusto puede tardar alrededor de 10 milisegundos en procesar un cuadro. Sin embargo, en dispositivos más pequeños, puede extenderse a 80 milisegundos o más. Es como intentar correr una carrera mientras todos los demás pasan volando porque sus zapatos son simplemente mejores.

Mantenerse al Día con el Tiempo

El tiempo también juega un papel importante en el rastreo. Para ser considerado "en tiempo real", un sistema generalmente necesita alcanzar alrededor de 24 cuadros por segundo (fps). Este es un número mágico que asegura que todo esté funcionando bien. Sin embargo, algunos métodos de rastreo pueden tardar mucho más, lo que los hace inadecuados para escenarios de movimiento rápido.

La competencia por mantener el ritmo es feroz. Algunos sistemas de rastreo existentes solo pueden manejar entre 5 y 20 milisegundos por cuadro, lo cual no es suficiente para decisiones rápidas cuando se manejan objetos en movimiento.

Confusión de Objetos

Otro gran problema es la confusión de objetos. Cuando los objetos están muy cerca, como en una escena concurrida, el sistema puede tener problemas para identificar quién es quién. Es como intentar reconocer a tus amigos en un bar lleno de gente-si todos llevan la misma camiseta, ¡buena suerte con eso!

Cuando rastreas un objeto, quieres saber no solo dónde está, sino también qué es. Cuanto más concurrido se pone, más fácil es que los objetos sean mal identificados, y eso puede desestabilizar todo.

¿Cómo Lo Arreglamos?

Entonces, ¿cómo construimos un mejor sistema de rastreo que funcione en dispositivos más pequeños? Innovando nuevos métodos que puedan manejar inteligentemente los recursos limitados disponibles mientras siguen ofreciendo resultados decentes. Aquí hay un vistazo a las estrategias en juego.

Muestreo Dinámico

Un enfoque es algo llamado muestreo dinámico. Aquí es donde el sistema decide cuándo necesita buscar nuevos objetos según lo que está sucediendo en el video. Si ve una escena ocupada, puede aumentar la frecuencia con la que revisa los objetos. Piensa en esto como un operador de cámara en un evento deportivo que hace zoom en la acción cuando la pelota se acerca, pero se aleja cuando no pasa nada emocionante.

Esta técnica permite menos revisiones en escenas más simples mientras se intensifica en esos momentos caóticos.

Asociación Inteligente

Otro truco inteligente es usar estrategias de asociación inteligente, que significa conectar los puntos entre los objetos detectados y seguir el rastro de sus movimientos. Cuando se ve un objeto, el sistema puede adivinar dónde podría aparecer en el siguiente cuadro, al igual que podrías predecir en qué dirección correrá tu amigo en un juego de etiqueta.

Hay dos estrategias principales para esto:

  1. Hop Fuse – Esta estrategia entra en juego cuando hay nueva información de detección disponible. Une efectivamente las detecciones más recientes con la información anterior para seguir el rastro de dónde está todo.

  2. Hop Update – Esta trabaja constantemente, ajustando la información de rastreo a medida que llegan nuevos cuadros. Es como tener un diálogo constante con el cuadro, averiguando si algo ha cambiado, como si alguien en la multitud repentinamente cambia de dirección.

Estos métodos trabajan bien juntos, permitiendo ajustes rápidos y ayudando al sistema a recordar quién es quién, incluso en escenas concurridas.

¿Cómo Se Desempeña?

Cuando se trata de rendimiento, lograr una gran precisión manteniendo la velocidad es el objetivo. Este nuevo enfoque ha logrado números impresionantes. En pruebas, el marco alcanzó hasta 39 cuadros por segundo con niveles de precisión del 63% para rastrear múltiples objetos. Esta es una mejora significativa sobre muchos métodos tradicionales que apenas mantienen el ritmo.

Lo que es aún mejor es que este sistema no necesita un ordenador lujoso y caro para hacer su trabajo. Puede funcionar de manera eficiente en dispositivos de gama media, convirtiéndolo no solo en un rastreador potente, sino también en uno rentable.

Eficiencia de Energía y Memoria

Trabajar con recursos limitados también significa estar atento al consumo de energía y uso de memoria. Esto es crucial para dispositivos que pueden estar funcionando con baterías o que necesitan operar silenciosamente en segundo plano.

El nuevo sistema ha demostrado que puede hacer esto de manera eficiente. Usa hasta un 20% menos de energía y ocupa menos memoria que muchos otros sistemas de rastreo. Esto lo convierte en una opción ideal para aplicaciones que necesitan funcionar en el borde, como robots móviles o sistemas de vigilancia.

Conclusión

En resumen, el rastreo en tiempo real en dispositivos integrados es una tarea complicada, muy parecida a tratar de mantener el control de todos tus amigos en un festival de música. Con las estrategias adecuadas, como el muestreo dinámico y la asociación inteligente, es posible lograr resultados impresionantes sin necesidad de un ordenador de alto nivel. La tecnología está creciendo y evolucionando, haciendo del rastreo de múltiples objetos en tiempo real no solo un sueño, sino una realidad.

A medida que seguimos empujando los límites, ¿quién sabe? Pronto, rastrear una calle llena de gente o encontrar la mejor ruta en un parque concurrido podría hacerse tan fácil como un paseo por el parque. Con los sistemas adecuados, el rastreo podría llegar a ser algún día tan despreocupado y fluido como ver tu camión de helados favorito en un día caluroso.

¡Así que mantente atento! El futuro del rastreo no solo se trata de seguir objetos-se trata de hacerlo accesible, amigable y lo más eficiente posible para todos.

Más de autores

Artículos similares