Avancées dans la mesure des mouvements oculaires
De nouvelles méthodes améliorent notre évaluation des mouvements des yeux et leur relation avec la position de la tête.
― 6 min lire
Table des matières
Pour bien comprendre comment le cerveau contrôle les mouvements des yeux, faut pas juste regarder les mouvements de côté et haut-bas. Il est aussi super important de considérer comment les yeux s'inclinent. Cette inclinaison, appelée torsion oculaire, concerne la façon dont les yeux tournent autour de leur ligne de vision. Ces mouvements torsionnels sont essentiels pour évaluer comment notre vision réagit quand on bouge la tête, surtout quand on incline la tête sur le côté.
Quand tu penches la tête, tes yeux s’ajustent aussi pour garder ta vision stable et concentrée. Cet ajustement peut se voir comme deux phases : un mouvement lent et une correction rapide. Par exemple, si quelqu'un incline sa tête vers la gauche, ses yeux bougent lentement vers la droite, puis reviennent vite à gauche. Si la tête est penchée plus longtemps, les yeux resteront dans cette nouvelle position sans la correction rapide.
Le cerveau utilise des signaux de nos oreilles internes pour suivre les mouvements de la tête et ajuster la position des yeux en conséquence. Ce lien est vital pour diagnostiquer des problèmes liés à l'équilibre et à la vision. Des soucis peuvent surgir en cas de dommages dans les oreilles internes ou dans certaines zones du cerveau responsables de ces fonctions.
Contre-roulement oculaire (OCR)
Quand quelqu'un incline sa tête, la façon dont ses yeux s'ajustent s'appelle contre-roulement oculaire (OCR). Cet ajustement consiste en un changement rapide pendant l'inclinaison et un ajustement stable une fois que la tête s'arrête de bouger. Les mouvements rapides sont appelés nystagmus torsionnel, tandis que l'ajustement stable s'appelle OCR statique.
Traditionnellement, mesurer ces mouvements oculaires se fait avec une méthode appelée vidéo contre-roulement oculaire (vOCR). Ça implique de suivre le mouvement de l'iris, qui est la partie colorée de l'œil. Cependant, cette méthode peut être compliquée, car les paupières peuvent cacher l’iris, affectant les mesures. De plus, cette technologie n’est pas courante en dehors des milieux cliniques et nécessite des pros pour l’utiliser, rendant les évaluations rapides plus difficiles.
D'autres facteurs, comme la taille de la pupille et les mouvements des paupières, peuvent aussi influencer la détection des mouvements subtils des yeux, mais ces points n'ont pas vraiment été abordés dans les recherches précédentes.
Développement de nouvelles méthodes pour mesurer la torsion oculaire
En réponse à ces limitations, de nouvelles méthodes ont émergé pour détecter les changements dans les mouvements oculaires en utilisant le deep learning. En appliquant des techniques avancées, on peut examiner une gamme plus large de caractéristiques pour identifier ces mouvements oculaires. Cette approche peut être particulièrement bénéfique pour les médecins qui évaluent des patients souffrant de vertiges ou de vision double.
Traitement des données
La recherche a commencé avec un ensemble de données de vidéos brutes de mouvements oculaires. Chaque vidéo montrait comment les yeux réagissaient aux inclinaisons de la tête. Pour garantir une analyse approfondie, chaque vidéo a été divisée en courts clips, permettant un examen minutieux des mouvements torsionnels. Les clips ont été choisis pour inclure à la fois des mouvements avec et sans changements torsionnels, créant ainsi un ensemble de données équilibré.
Cet ensemble de données a été établi grâce à une méthode qui a augmenté le nombre de clips sans perdre la variété des clips montrant les mouvements torsionnels. Chaque vidéo a été standardisée pour garantir une représentation égale, évitant ainsi les biais lors de l'entraînement du modèle.
Entraînement des modèles de deep learning
Pour l’analyse, un modèle spécifique appelé ResNet-18 a été choisi comme point de départ. La recherche a utilisé deux types de modèles ResNet : un modèle standard en deux dimensions et une version plus avancée appelée modèle 2.5D. Le modèle 2.5D a combiné des informations d'une série de cadres, capturant à la fois des changements immédiats et séquentiels dans la position des yeux.
L'entrée pour ces modèles était constituée de 50 images vidéo consécutives, permettant une évaluation complète des patterns de mouvement oculaire. Pour rendre les modèles plus efficaces, des techniques ont été utilisées pour changer légèrement les images, les aidant à mieux s'adapter à différents scénarios.
Au fur et à mesure que les modèles étaient entraînés, ils examinaient des milliers de clips, améliorant leur capacité à détecter les mouvements oculaires avec le temps. Le processus d’entraînement impliquait deux ensembles : un pour l'entraînement et un pour valider la performance du modèle. Cette étape était cruciale pour s'assurer que le produit final soit à la fois précis et fiable.
Comparaison des performances des modèles
En termes de performance, le modèle 2.5D a montré de meilleurs résultats dans la détection des mouvements oculaires, atteignant une plus grande précision par rapport au modèle 2D standard. Cela a indiqué que la complexité supplémentaire du modèle 2.5D permettait une analyse plus efficace des données.
Un aspect important de ces modèles est leur interprétabilité, ce qui fait référence à la façon dont on peut comprendre quelles caractéristiques sont utilisées pour prendre des décisions. En appliquant une méthode appelée Grad-CAM, les chercheurs pouvaient visualiser quelles parties de l'image étaient les plus pertinentes pour faire des prédictions. Cette analyse a montré que les deux modèles se concentraient fortement sur l'iris, qui est un marqueur significatif pour identifier les mouvements torsionnels dans un cadre clinique.
Conclusion
Les avancées dans la détection de la torsion oculaire grâce aux méthodes de deep learning représentent un changement dans la manière dont les mouvements oculaires peuvent être évalués. En se concentrant sur les données visuelles et temporelles, ces modèles montrent un potentiel pour améliorer les capacités de diagnostic, surtout dans des situations de vertiges ou de vision double.
Alors que les méthodes traditionnelles rencontraient des défis en matière d'accessibilité et de précision, la nouvelle approche utilisant le deep learning peut élargir les possibilités d’évaluations dans divers milieux, y compris ceux sans équipement spécialisé. Au fur et à mesure que la technologie continue d’évoluer, l'objectif est d'affiner ces méthodes encore plus, en incorporant potentiellement une analyse en trois dimensions pour des mesures encore plus précises dans le futur.
En avançant, l'objectif reste clair : améliorer notre compréhension des mouvements oculaires et améliorer les soins aux patients souffrant de problèmes liés. En adoptant des techniques innovantes, on peut espérer fournir des évaluations plus rapides et plus précises, menant à de meilleurs résultats pour les personnes ayant des défis vestibulaires et oculomoteurs.
Titre: Deep Learning Detection of Subtle Torsional Eye Movements: Preliminary Results
Résumé: The control of torsional eye position is a key component of ocular motor function. Ocular torsion can be affected by pathologies that involve ocular motor pathways, spanning from the vestibular labyrinth of the inner ears to various regions of the brainstem and cerebellum. Timely and accurate diagnosis enables efficient interventions and management of each case which are crucial for patients with dizziness, vertical double vision, or imbalance. Such detailed evaluation of eye movements may not be possible in all frontline clinical settings, particularly for detecting torsional abnormalities. These abnormalities are often more challenging to identify at the bedside compared to horizontal or vertical eye movements. To address these challenges, we used a dataset of torsional eye movements recorded with video-oculography (VOG) to develop deep learning models for detecting ocular torsion. Our models achieve 0.9308 AUROC and 86.79 % accuracy, leveraging ocular features particularly pertinent to tracking torsional eye position.
Auteurs: Kemar Earl Green, K. N. Mukunda, T. Ye, Y. Luo, A. Zoitou, K. E. Kwon, R. Singh, J. Woo, N. Sivakumar, J. L. Greenstein, C. O. Taylor, A. Kheradmand
Dernière mise à jour: 2024-05-26 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.05.26.595236
Source PDF: https://www.biorxiv.org/content/10.1101/2024.05.26.595236.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.