Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Ingeniería Eléctrica y Ciencia de Sistemas# Procesado de señales

Avances en la tecnología de reconocimiento de actividades humanas

Una mirada a los nuevos métodos HAR usando sensores infrarrojos de baja resolución.

― 7 minilectura


HAR innovador conHAR innovador consensores infrarrojoslimitados.actividades humanas usando datosSCDNN mejora el reconocimiento de
Tabla de contenidos

El Reconocimiento de Actividad Humana (HAR) es una parte importante de la tecnología moderna. Permite que las máquinas entiendan qué están haciendo las personas en diferentes situaciones. Esta tecnología es especialmente útil en casas y lugares de trabajo inteligentes. Con el auge del Internet de las Cosas (IoT), los sistemas HAR se han vuelto un área popular de investigación. Estos sistemas pueden ayudar a monitorear la seguridad y apoyar varias tareas sin ser intrusivos.

Importancia del HAR

Los sistemas HAR pueden alertarnos sobre peligros potenciales. Por ejemplo, pueden detectar si alguien se ha caído en un lugar de trabajo y enviar alertas para pedir ayuda. En casas inteligentes, pueden ayudar a controlar las luces y los electrodomésticos, o incluso monitorear actividades relacionadas con la salud. Los métodos tradicionales de HAR a menudo dependen de cámaras de video o sensores portátiles, pero esto puede generar preocupaciones de privacidad o no siempre ser práctico.

Desafíos con los Métodos Actuales

Los métodos HAR actuales a menudo se basan en datos visuales de cámaras. Esto puede ser limitante porque es sensible a cambios en la iluminación o si la gente se sale del campo de visión. Los dispositivos portátiles podrían ayudar, pero la gente no siempre los usa, lo que los hace poco fiables. Recientemente, usar Información de Estado del Canal (CSI) para HAR ha ganado popularidad. Sin embargo, este método también tiene sus inconvenientes, ya que requiere múltiples dispositivos para funcionar, lo que complica la configuración y el despliegue.

Los sensores infrarrojos de baja resolución están surgiendo como una alternativa prometedora. Son asequibles, respetuosos con la privacidad y pueden funcionar bien sin luz. Estos sensores pueden capturar datos de temperatura vitales que pueden indicar actividad humana. Sin embargo, recopilar datos precisos puede ser un desafío debido a su resolución limitada.

Cómo Funcionan los Sensores Infrarrojos de Baja Resolución

Los sensores infrarrojos de baja resolución, como el AMG8833, proporcionan una matriz de lecturas de temperatura. En lugar de capturar imágenes detalladas, detectan el calor de personas u objetos en su campo. Aunque son menos detallados que las cámaras de alta resolución, todavía pueden reconocer ciertas actividades de manera efectiva.

Estos sensores pueden capturar datos de varios escenarios, que luego pueden ser analizados para determinar acciones humanas como estar sentado, de pie o caminando. Por ejemplo, los investigadores han utilizado sensores infrarrojos de baja resolución para identificar acciones específicas analizando patrones de temperatura.

La Necesidad de Nuevas Técnicas

Usar técnicas tradicionales de aprendizaje profundo requiere muchos datos para el entrenamiento. Esto es especialmente cierto cuando se trata de diferentes entornos. Cuando cambian las condiciones, los modelos entrenados en un entorno pueden no funcionar bien en otro. Es crucial adaptar los sistemas HAR a entornos cambiantes.

La idea es crear un método que no dependa tanto de la cantidad de datos recopilados. En su lugar, debería usar conjuntos más pequeños de datos etiquetados y no etiquetados para seguir siendo efectivo en diferentes configuraciones.

Introducción del SCDNN

Para abordar las limitaciones de los enfoques actuales de HAR, se ha propuesto un nuevo método llamado Red Neuronal Semisupervisada de Dominio Cruzado (SCDNN). Esta técnica está diseñada para trabajar con sensores infrarrojos de baja resolución.

El modelo SCDNN incluye varios componentes:

  1. Extractor de características: Esta parte identifica características clave de los datos, sin importar de qué entorno provengan.

  2. Discriminador de Dominio: Ayuda a diferenciar si los datos son del entorno de origen o de un nuevo dominio objetivo.

  3. Clasificador de Etiquetas: Este componente intenta asignar la categoría de actividad correcta a los datos que recibe.

El modelo SCDNN se centra en minimizar la necesidad de datos etiquetados extensos mientras mejora la precisión del reconocimiento en diferentes entornos.

Pasos en el Proceso SCDNN

El marco SCDNN sigue tres pasos principales:

  1. Adquisición de Datos: Los sensores infrarrojos recopilan datos de temperatura tanto del entorno de origen como del objetivo.

  2. Entrenamiento del Modelo: El SCDNN utiliza datos etiquetados del dominio de origen y una pequeña cantidad de datos etiquetados del dominio objetivo para entrenar el sistema.

  3. Reconocimiento de Actividades: Después del entrenamiento, el modelo puede reconocer actividades con precisión en el nuevo entorno.

Métodos de Recopilación de Datos

En la fase de recopilación de datos, se utiliza un sensor infrarrojo de baja resolución para capturar cambios de temperatura durante varias actividades. Estas actividades incluyen acostarse, sentarse, caminar, y más. Los datos se organizan y se envían a un servidor para su análisis.

Antes de entrenar el modelo, los datos recopilados deben procesarse para eliminar el ruido de otras fuentes de calor. Este ruido puede provenir de factores ambientales o inexactitudes del sensor.

Preprocesamiento de Datos

Para asegurarse de que los datos sean limpios y útiles, se aplican varios métodos de preprocesamiento:

  • Sustracción de Fondo: Esta técnica elimina la temperatura base para enfocarse en los cambios causados por las actividades humanas. Ayuda a distinguir el calor humano de otras fuentes de calor.

  • Filtrado: Además, se puede utilizar un filtro Butterworth para reducir las fluctuaciones aleatorias en los datos.

El objetivo de estos pasos de preprocesamiento es asegurar que los datos infrarrojos reflejen claramente las actividades humanas sin perturbaciones externas.

Implementación del SCDNN

El modelo SCDNN está diseñado para aprender tanto de datos etiquetados como no etiquetados. Esto es esencial en situaciones donde etiquetar todos los datos es poco práctico.

Durante el entrenamiento, el modelo aprende a diferenciar actividades de ambos dominios, de origen y objetivo. El objetivo es alinear los datos de ambos entornos para que pueda clasificar actividades correctamente, sin importar la configuración.

El modelo está estructurado para asegurarse de que puede funcionar de manera efectiva con datos etiquetados limitados. Esta es una ventaja crucial, especialmente cuando se trata de adaptarse a nuevos entornos.

Configuración Experimental y Resultados

Para validar el método SCDNN, se realizaron experimentos en entornos interiores controlados. El sensor se colocó a una altura donde podría capturar las actividades humanas sin obstrucciones.

Los experimentos midieron la precisión de reconocimiento del modelo en ocho actividades diferentes. Los resultados mostraron que SCDNN logró una precisión impresionante del 92.12% al reconocer actividades cuando se probó en un entorno diferente.

Importancia de los Datos No Etiquetados

El número de muestras no etiquetadas juega un papel crítico en el rendimiento del modelo. Cuando aumentó el número de muestras no etiquetadas, la precisión mejoró significativamente.

Sin embargo, después de alcanzar un cierto punto, agregar demasiadas muestras llevó a un sobreajuste. Esto significa que el modelo se volvió demasiado específico para los datos de entrenamiento y menos efectivo al enfrentarse a nuevos datos.

Impacto de los Datos Etiquetados

Similar a los datos no etiquetados, la presencia de muestras etiquetadas también tuvo un impacto significativo. La precisión del modelo mejoró a medida que se incluían más muestras etiquetadas en el entrenamiento.

Esto demostró que tener incluso una pequeña cantidad de datos etiquetados puede mejorar la capacidad del modelo para generalizar y reconocer actividades con precisión.

Comparación con Otros Métodos

El SCDNN se comparó con varias otras técnicas, incluidos modelos de aprendizaje automático y aprendizaje profundo tradicionales. Los resultados mostraron que el SCDNN superó estos métodos en todas las métricas evaluadas.

El SCDNN proporcionó mejor precisión y robustez en el reconocimiento de actividades humanas, especialmente en escenarios de dominio cruzado.

Conclusión

El método SCDNN muestra un gran potencial para mejorar los sistemas HAR, especialmente al usar sensores infrarrojos de baja resolución. Al reducir la dependencia de grandes conjuntos de datos y permitir un reconocimiento efectivo en entornos cambiantes, este enfoque abre el camino para soluciones HAR más prácticas y eficientes en el futuro.

Todavía hay áreas de mejora, como explorar la aplicación del SCDNN en entornos variados o integrar múltiples sensores para ampliar sus capacidades. La investigación continua en este campo puede llevar a métodos aún mejores para reconocer actividades humanas en diversos entornos.

Fuente original

Título: Human Activity Recognition with Low-Resolution Infrared Array Sensor Using Semi-supervised Cross-domain Neural Networks for Indoor Environment

Resumen: Low-resolution infrared-based human activity recognition (HAR) attracted enormous interests due to its low-cost and private. In this paper, a novel semi-supervised crossdomain neural network (SCDNN) based on 8 $\times$ 8 low-resolution infrared sensor is proposed for accurately identifying human activity despite changes in the environment at a low-cost. The SCDNN consists of feature extractor, domain discriminator and label classifier. In the feature extractor, the unlabeled and minimal labeled target domain data are trained for domain adaptation to achieve a mapping of the source domain and target domain data. The domain discriminator employs the unsupervised learning to migrate data from the source domain to the target domain. The label classifier obtained from training the source domain data improves the recognition of target domain activities due to the semi-supervised learning utilized in training the target domain data. Experimental results show that the proposed method achieves 92.12\% accuracy for recognition of activities in the target domain by migrating the source and target domains. The proposed approach adapts superior to cross-domain scenarios compared to the existing deep learning methods, and it provides a low-cost yet highly adaptable solution for cross-domain scenarios.

Autores: Cunyi Yin, Xiren Miao, Jing Chen, Hao Jiang, Deying Chen, Yixuan Tong, Shaocong Zheng

Última actualización: 2024-03-04 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2403.02632

Fuente PDF: https://arxiv.org/pdf/2403.02632

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares