Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes# Apprentissage automatique

Utiliser la technologie pour classer les poses de yoga

Utiliser l'apprentissage automatique pour identifier les poses de yoga pour une meilleure pratique.

― 9 min lire


La tech rencontre laLa tech rencontre lareconnaissance des posesde yogaà la technologie intelligente.Révolutionner la pratique du yoga grâce
Table des matières

Le yoga est devenu super important pour notre santé et notre bien-être. Beaucoup de gens essaient de rester en forme tout en jonglant entre le boulot et la vie à la maison, et la salle de sport passe souvent à la trappe. Une façon cool d'aider avec ça, c'est de repérer les poses de yoga grâce à la technologie. Mais attends, savais-tu que c'est pas si simple d'identifier ces poses ? Ouais, il s'agit de localiser où sont nos articulations. Il y a un dataset appelé Yoga-82 avec un énorme total de 82 poses différentes, et disons juste que certaines d'entre elles sont plus dures à étiqueter qu'un chat dans un bain !

On a testé quelques modèles informatiques bien connus comme VGG-16, ResNet-50, ResNet-101 et DenseNet-121 pour nous aider à identifier ces poses. Après quelques bidouillages, DenseNet-121 a vraiment brillé avec une précision impressionnante de 85%. C'est comme toucher le jackpot aux fléchettes !

C'est quoi la Reconnaissance d'Activité Humaine (HAR)

Alors, la Reconnaissance d'Activité Humaine (HAR), c'est quoi au juste ? C'est en gros une façon classe de dire qu'on essaie de comprendre ce que les gens font, soit à partir de vidéos ou de capteurs. Pense à ça comme un détective super chargé qui utilise des algorithmes pour repérer les actions.

Les poses de yoga comptent comme une activité spécifique, et HAR peut aider à les reconnaître. Comment ? En analysant des vidéos ou des données de capteurs pendant que quelqu'un enchaîne sa routine de yoga. Ça peut être super utile pour les profs de yoga ou même juste pour éviter que les gens se blessent en faisant un chien tête en bas de travers.

L'Émergence des Entraîneurs Personnels Virtuels

L'apprentissage automatique est là pour aider les gens à s'entraîner plus intelligemment. Certains systèmes peuvent maintenant donner des conseils d'exercice en fonction de ce que tu fais. Imagine un entraîneur virtuel qui connaît ton niveau de fitness et propose des séances personnalisées. Ils s'adaptent même en temps réel selon ta fréquence cardiaque, les calories brûlées et d'autres métriques. C'est comme avoir un pote de gym qui sait exactement quand tu lâches l'affaire !

La technologie portable comme les trackers de fitness sont aussi de la partie. Ils utilisent des données pour te donner des retours sur ton cheminement fitness. Donc si tu t'es déjà demandé si cette nouvelle montre connectée est vraiment capable de suivre tes poses de yoga, la réponse est : peut-être !

Yoga et Soulagement du Stress

Pendant la pandémie, le yoga a encore plus gagné en popularité. Les gens s'y sont tournés pour gérer le stress. Mais pour vraiment en profiter, tu dois maîtriser ces poses. Le problème ? Tout le monde peut pas se payer un prof de yoga.

C'est là que la technologie peut intervenir. Si on pouvait créer une appli qui fait office de prof de yoga personnel, on pourrait aider plein de gens qui veulent pratiquer mais ne trouvent pas de coach. Les méthodes de vérification des poses peinent souvent à cause de la grande variété de types de corps et de poses. Alors, on s'est dit, pourquoi pas se concentrer sur la pose dans son ensemble au lieu de pointer chaque articulation ?

Notre Grande Idée

On a entrepris de créer un système de classification qui regarde les similarités entre les poses. En faisant ça, on peut aider plus de gens à accéder au yoga, même s'ils peuvent pas recevoir des retours en temps réel de la part d'un entraîneur.

Voici ce qu'on a fait :

  1. Prétraitement d'images : On a testé différentes techniques pour améliorer les images avant de les analyser.
  2. Apprentissage par transfert : On a piqué des connaissances de modèles pré-entraînés pour gagner du temps et des ressources lors de l'entraînement de notre modèle.
  3. Recherche de Réseau : On a utilisé la recherche aléatoire pour trouver la meilleure structure pour notre modèle.

Et voilà ! On avait un système capable de classifier les poses de yoga sans devoir repérer chaque petite articulation.

Ce Que D'autres Ont Fait

Voyons ce qui a été fait dans le monde de la reconnaissance de poses de yoga jusqu'à présent. Certains chercheurs ont utilisé l'apprentissage profond pour reconnaître les articulations sur des images avec succès, ce qui a permis d'identifier les poses. Mais d'autres ont souligné qu'avec tant de façons différentes dont un corps humain peut bouger, les méthodes traditionnelles ratent souvent leur cible.

Dans le monde du yoga, les gens ont commencé à remarquer un pic d'intérêt pendant le COVID-19. Des cours de yoga à distance ont fleuri de partout, aidant les gens à réduire le stress et à rester en forme. Certains chercheurs ont même constitué des datasets de milliers d'images de poses de yoga, testant divers modèles d'apprentissage machine pour voir lesquels fonctionnaient le mieux.

Un tas d'esprits brillants ont décidé de combiner méthodes traditionnelles et apprentissage profond pour booster leurs résultats. Qui n'aime pas une bonne approche hybride ?

À Travailler sur Yoga-82

On a concentré nos efforts sur le dataset Yoga-82, qui contient plus de 21 000 images d'entraînement et environ 7 500 images de test, toutes montrant ces 82 poses différentes. Le dataset divise les poses en cinq classes principales : debout, assis, équilibre, inversé et allongé. Chacune d'elles a plusieurs sous-classes, ce qui facilite l'identification des poses.

Avant de montrer les images à notre modèle, on les a préparées. On a amélioré les images pour rendre les parties du corps plus faciles à voir. Le contraste peut mettre en avant certaines caractéristiques, aidant le modèle à mieux comprendre ce qui se passe.

La Magie du Prétraitement

Alors, comment on a amélioré nos images ? Voici les étapes qu'on a suivies :

  1. Amélioration du Contraste : Cette étape a éclairci les zones claires et assombri les parties sombres, rendant plus facile pour notre modèle de voir sur quoi il doit se concentrer - les parties du corps qui comptent.

  2. Filtrage Médian : Une fois qu'on a augmenté le contraste, le bruit est devenu un problème. On a utilisé un filtre médian pour lisser le tout sans perdre trop de détails.

  3. Affûtage d'Images : Après le filtrage, certaines images ont fini un peu floues. On a utilisé une technique d'affûtage pour rendre ces contours plus nets, réduisant toute confusion qui s'était installée.

Apprentissage par Transfert à la Rescousse

Maintenant, parlons de l'apprentissage par transfert. C'est une méthode qui utilise les connaissances d'un modèle pré-entraîné pour accélérer le processus d'apprentissage pour de nouvelles tâches. C'est un peu comme vouloir cuire un gâteau mais réaliser que tu as déjà une super recette de ta tante - ça te ferait gagner du temps, non ?

On a pris quelques modèles bien connus comme VGG-16, ResNet-50 et DenseNet-121 et on les a modifiés pour correspondre à nos besoins en yoga.

VGG-16

Ce modèle est connu pour sa structure simple. Il est souvent le choix de nombreux débutants dans le monde de l'apprentissage profond. C'est souvent utilisé comme un modèle de base car il est facile à adapter.

ResNet-50

ResNet-50 gère les réseaux plus profonds comme un pro, grâce à son usage astucieux de connexions de saut qui permettent au modèle de surmonter le soi-disant problème du 'gradient qui disparaît'. Il a des couches qui captent les caractéristiques à bas niveau de l'image, parfait pour nos poses de yoga.

DenseNet-121

DenseNet-121 est une approche moderne avec une petite touche. Il connecte les couches d'une manière qui favorise le partage de caractéristiques, aidant le modèle à apprendre plus efficacement. On a trouvé que c'était le meilleur choix pour notre classification de poses de yoga.

Nos Résultats

On a mis nos modèles à l'épreuve avec plusieurs configurations, découvrant que DenseNet-121 performait le mieux. Cependant, VGG-16 avait aussi ses moments, surtout quand on a juste affiné les dernières couches. D'un autre côté, ResNet-50 ne s'en est pas si bien sorti quand on a gelé la plupart des couches.

En gros, utiliser DenseNet-121 nous a permis de surpasser les résultats existants !

Classification des Poses de Yoga

La partie difficile de la classification des poses de yoga, c'est que beaucoup d'entre elles se ressemblent. C'est comme essayer de distinguer des jumeaux identiques qui portent les mêmes vêtements ! C'est pourquoi certains chercheurs ont délaissé la détection de points clés pour s'attaquer directement au défi de la classification d'images. Avec l'apprentissage machine de notre côté, ces problèmes de classification sont devenus beaucoup plus faciles à gérer.

On a finalement vu des résultats prometteurs, grâce à l'apprentissage par transfert et nos ajustements sur les modèles. Mais l'aventure ne s'arrête pas là !

Qu'est-ce qui Suit ?

On est super excités de continuer à repousser les limites ! Nos prochaines étapes incluent d'essayer différentes approches, comme combiner plusieurs modèles d'apprentissage. On veut aussi plonger plus profondément dans la compréhension de la façon dont notre modèle prend ses décisions - ce qui veut dire jeter un œil à des outils comme GradCam.

En bonus, explorer de nouvelles techniques de traitement pourrait aussi améliorer nos méthodes actuelles. De plus, s'attaquer à tous les biais qui apparaissent dans nos modèles pourrait rendre notre classification de poses de yoga encore meilleure.

Voilà, une aventure dans le monde des poses de yoga, de la technologie, et une pointe d'humour en chemin. Qui aurait cru qu'identifier des poses de yoga pourrait être si amusant ? Et le meilleur dans tout ça ? Tout le monde a accès au yoga, que ce soit avec ou sans entraîneur dans la poche !

Source originale

Titre: Yoga Pose Classification Using Transfer Learning

Résumé: Yoga has recently become an essential aspect of human existence for maintaining a healthy body and mind. People find it tough to devote time to the gym for workouts as their lives get more hectic and they work from home. This kind of human pose estimation is one of the notable problems as it has to deal with locating body key points or joints. Yoga-82, a benchmark dataset for large-scale yoga pose recognition with 82 classes, has challenging positions that could make precise annotations impossible. We have used VGG-16, ResNet-50, ResNet-101, and DenseNet-121 and finetuned them in different ways to get better results. We also used Neural Architecture Search to add more layers on top of this pre-trained architecture. The experimental result shows the best performance of DenseNet-121 having the top-1 accuracy of 85% and top-5 accuracy of 96% outperforming the current state-of-the-art result.

Auteurs: M. M. Akash, Rahul Deb Mohalder, Md. Al Mamun Khan, Laboni Paul, Ferdous Bin Ali

Dernière mise à jour: 2024-10-29 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2411.00833

Source PDF: https://arxiv.org/pdf/2411.00833

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires