Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones# Aprendizaje automático

Usando la tecnología para clasificar las posturas de yoga

Aprovechando el aprendizaje automático para identificar poses de yoga y mejorar la práctica.

― 9 minilectura


La tecnología seLa tecnología seencuentra con elreconocimiento detravés de la tecnología inteligente.Revolucionando la práctica de yoga a
Tabla de contenidos

El yoga se ha vuelto muy importante para nuestra salud y bienestar. Muchas personas están intentando mantenerse en forma mientras equilibran trabajo y vida en casa, y el gimnasio a menudo pasa a un segundo plano. Una forma interesante de ayudar con esto es a través de la tecnología para identificar las posturas de yoga. Pero espera, ¿sabías que identificar esas posturas puede ser complicado? Así es, se trata de localizar dónde están nuestras articulaciones. Hay un conjunto de datos llamado Yoga-82 con un sorprendente total de 82 posturas diferentes, y digamos que algunas de ellas son más difíciles de etiquetar que un gato en una bañera.

Hemos experimentado con algunos modelos de computadora conocidos como VGG-16, ResNet-50, ResNet-101 y DenseNet-121 para ayudarnos a identificar estas posturas. Después de algunos ajustes, DenseNet-121 realmente destacó con una precisión impresionante del 85%. ¡Eso es como dar en el blanco en dardos!

¿Qué es el Reconocimiento de Actividades Humanas (HAR)?

Entonces, ¿qué es el Reconocimiento de Actividades Humanas (HAR)? Básicamente, es una forma elegante de decir que estamos tratando de averiguar qué están haciendo las personas, ya sea a través de videos o sensores. Piénsalo como un detective supercargado que usa algoritmos para detectar acciones.

Las posturas de yoga cuentan como una actividad específica, y HAR puede ayudar a reconocerlas. ¿Cómo? Analizando videos o datos de sensores mientras alguien fluye a través de su rutina de yoga. Esto puede ser super útil para los profesores de yoga o incluso solo para mantener a la gente a salvo de hacer un perro mirando hacia abajo de manera incorrecta y lesionarse.

El Auge de los Entrenadores Personales Virtuales

El aprendizaje automático está ayudando a las personas a hacer ejercicio de manera más inteligente, no más dura. Algunos sistemas ahora pueden ofrecer consejos de ejercicio basados en cómo lo estás haciendo. Imagina un entrenador virtual que conoce tu nivel de condición física y puede proporcionarte entrenamientos personalizados. Incluso se adaptan sobre la marcha según tu frecuencia cardíaca, calorías quemadas y otras métricas. ¡Es como tener un compañero de gimnasio que sabe exactamente cuándo estás flojeando!

La tecnología portátil como los rastreadores de fitness también se está subiendo a este tren. Están utilizando datos para dar retroalimentación sobre tu viaje de fitness. Así que si alguna vez te has preguntado si ese nuevo reloj inteligente realmente está haciendo seguimiento de tus posturas de yoga, la respuesta es: ¡tal vez!

Yoga y Alivio del Estrés

Durante la pandemia, el yoga se ha vuelto aún más popular. La gente ha recurrido a él para ayudar a manejar el estrés. Pero para realmente beneficiarte, tienes que dominar esas posturas. ¿El problema? No todos pueden pagar un instructor de yoga.

Aquí es donde la tecnología puede intervenir. Si podemos crear una aplicación que actúe como tu profesor de yoga personal, podríamos ayudar a muchas personas que quieren practicar pero no pueden encontrar un entrenador. Los métodos regulares de verificación de posturas a menudo tienen problemas debido a la gran variedad de tipos de cuerpo humano y posturas. Entonces, pensamos, ¿por qué no enfocarnos en la postura general en lugar de identificar cada articulación?

Nuestra Gran Idea

Nos propusimos crear un sistema de clasificación que observase las similitudes entre las posturas. Al hacer esto, podemos ayudar a más personas a acceder al yoga, incluso si no pueden obtener retroalimentación en tiempo real de un entrenador.

Esto es lo que hicimos:

  1. Preprocesamiento de Imágenes: Probamos varias técnicas para mejorar las imágenes antes de analizarlas.
  2. Transferencia de Aprendizaje: Tomamos conocimientos de modelos preentrenados para ahorrar tiempo y recursos al entrenar nuestro modelo.
  3. Búsqueda de Redes: Utilizamos Búsqueda Aleatoria para encontrar la mejor estructura para nuestro modelo.

¡Y voilà! Tuvimos un sistema que podía clasificar posturas de yoga sin necesidad de identificar cada pequeña articulación.

Lo Que Otros Han Hecho

Veamos lo que se ha hecho en el mundo del reconocimiento de posturas de yoga hasta ahora. Algunos investigadores han utilizado el aprendizaje profundo para reconocer articulaciones a partir de imágenes con éxito, lo que hace posible identificar posturas. Pero otros señalaron que, con tantas formas diferentes en que un cuerpo humano puede moverse, los métodos tradicionales a menudo se quedan cortos.

En el mundo del yoga, la gente empezó a notar un aumento en el interés durante el COVID-19. Las clases de yoga remotas surgieron en todas partes, ayudando a la gente a reducir el estrés y mantenerse en forma. Algunos investigadores incluso construyeron conjuntos de datos de miles de imágenes de posturas de yoga, probando varios modelos de aprendizaje automático para ver cuál funcionaba mejor.

Un montón de mentes brillantes decidieron combinar métodos tradicionales y de aprendizaje profundo para mejorar sus resultados. ¿A quién no le gusta un buen enfoque híbrido?

Trabajando en Yoga-82

Nos concentramos en el conjunto de datos Yoga-82, que contiene más de 21,000 imágenes de entrenamiento y unas 7,500 imágenes de prueba, todas mostrando esas 82 posturas diferentes. El conjunto de datos divide las posturas en cinco clases principales: de pie, sentado, equilibrado, invertido y reclinado. Cada una de estas tiene varias subclases, lo que facilita identificar las posturas.

Antes de mostrar las imágenes a nuestro modelo, las preparamos. Mejoramos las imágenes para que las partes del cuerpo sean más fáciles de ver. El contraste puede resaltar ciertas características, ayudando al modelo a tener una imagen más clara de lo que está sucediendo.

La Magia del Preprocesamiento

Entonces, ¿cómo mejoramos nuestras imágenes? Aquí están los pasos que seguimos:

  1. Mejora del Contraste: Este paso hizo que las áreas claras fueran más claras y las partes oscuras más oscuras, facilitando que nuestro modelo viera a qué tiene que prestar atención: las partes del cuerpo que importan.

  2. Filtrado Mediano: Una vez que aumentamos el contraste, el ruido se convirtió en un problema. Utilizamos un filtro mediano para suavizar las cosas sin perder demasiados detalles.

  3. Afilado de Imágenes: Después del filtrado, algunas imágenes resultaron un poco borrosas. Usamos una técnica de afilado para hacer que esos bordes fueran más nítidos, reduciendo cualquier borrosidad que se había colado.

Transferencia de Aprendizaje al Rescate

Ahora, hablemos de la transferencia de aprendizaje. Este es un método que utiliza conocimientos de un modelo preentrenado para acelerar el proceso de aprendizaje para nuevas tareas. Es como querer hornear un pastel pero darte cuenta de que ya tienes una gran receta de tu tía, ¡ahorraría tiempo, verdad?

Tomamos algunos modelos conocidos como VGG-16, ResNet-50 y DenseNet-121 y los ajustamos para adaptarlos a nuestras necesidades de yoga.

VGG-16

Este modelo es conocido por su estructura sencilla. Ha sido un recurso para muchos principiantes en el mundo del aprendizaje profundo. A menudo se usa como modelo base porque es fácil de adaptar.

ResNet-50

ResNet-50 maneja redes más profundas como un profesional, gracias a su ingenioso uso de conexiones de salto que permiten que el modelo supere el llamado problema del "gradiente que desaparece". Tiene capas que capturan características de bajo nivel en la imagen, perfectas para nuestras posturas de yoga.

DenseNet-121

DenseNet-121 es un enfoque moderno con un giro. Conecta capas de una manera que promueve el intercambio de características, ayudando al modelo a aprender de manera más eficiente. Descubrimos que era el más adecuado para nuestra clasificación de posturas de yoga.

Nuestros Hallazgos

Pusimos nuestros modelos a prueba con diversas configuraciones, descubriendo que DenseNet-121 tuvo el mejor desempeño. Sin embargo, VGG-16 tuvo sus momentos también, especialmente cuando solo ajustamos las últimas capas. Por otro lado, ResNet-50 no tuvo un buen rendimiento cuando congelamos la mayoría de las capas.

En general, usar DenseNet-121 nos ayudó a superar los resultados existentes.

Clasificando Posturas de Yoga

La parte difícil de clasificar posturas de yoga es que muchas de ellas se parecen. Es como intentar distinguir entre gemelos idénticos que llevan la misma ropa. Por eso algunos investigadores han cambiado de centrarse en la detección de puntos clave a abordar el desafío de la clasificación de imágenes directamente. Con el aprendizaje automático de nuestro lado, estos problemas de clasificación se han vuelto mucho más fáciles de abordar.

Al final, hemos visto resultados prometedores, gracias a la transferencia de aprendizaje y nuestros ajustes a los modelos. Pero la aventura no se detiene aquí.

¿Qué Sigue?

¡Estamos emocionados de seguir empujando los límites! Nuestros próximos pasos incluyen probar diferentes enfoques, como combinar múltiples modelos de aprendizaje. También queremos profundizar en entender cómo toma decisiones nuestro modelo, lo que significa explorar herramientas como GradCam.

Como un bono, explorar nuevas técnicas de procesamiento también puede ayudar a nuestros métodos actuales. Además, abordar cualquier sesgo que surja en nuestros modelos podría mejorar aún más nuestra clasificación de posturas de yoga.

Así que aquí lo tenemos: un viaje al mundo de las posturas de yoga, la tecnología y una pizca de humor a lo largo del camino. ¿Quién diría que identificar posturas de yoga podría ser tan divertido? ¡Y lo mejor de todo! Todos tienen acceso al yoga, ¡sean o no tengan un entrenador a su alcance!

Fuente original

Título: Yoga Pose Classification Using Transfer Learning

Resumen: Yoga has recently become an essential aspect of human existence for maintaining a healthy body and mind. People find it tough to devote time to the gym for workouts as their lives get more hectic and they work from home. This kind of human pose estimation is one of the notable problems as it has to deal with locating body key points or joints. Yoga-82, a benchmark dataset for large-scale yoga pose recognition with 82 classes, has challenging positions that could make precise annotations impossible. We have used VGG-16, ResNet-50, ResNet-101, and DenseNet-121 and finetuned them in different ways to get better results. We also used Neural Architecture Search to add more layers on top of this pre-trained architecture. The experimental result shows the best performance of DenseNet-121 having the top-1 accuracy of 85% and top-5 accuracy of 96% outperforming the current state-of-the-art result.

Autores: M. M. Akash, Rahul Deb Mohalder, Md. Al Mamun Khan, Laboni Paul, Ferdous Bin Ali

Última actualización: 2024-10-29 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2411.00833

Fuente PDF: https://arxiv.org/pdf/2411.00833

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares