Améliorer la détection des maladies oculaires grâce à l'apprentissage actif
Des recherches montrent que l'apprentissage actif améliore la capacité de l'IA à détecter les maladies oculaires dans les images OCTA.
― 7 min lire
Table des matières
Les maladies des yeux sont un gros souci pour les personnes âgées aux États-Unis, souvent causant une mauvaise vision ou même la cécité. Des conditions comme la dégénérescence maculaire liée à l'âge (DMA) et la rétinopathie diabétique (RD) peuvent vraiment affecter la vue. Avec environ 30 % des Américains de plus de 80 ans montrant des signes de DMA et un quart de ceux de plus de 40 ans ayant RD, il est super important de détecter ces problèmes tôt. Malheureusement, beaucoup de gens dans le monde souffrent d'une perte de vision évitable à cause de ces maladies.
Pour aider à diagnostiquer les problèmes oculaires, les médecins utilisent différentes technologies d'imagerie qui leur permettent de voir l'intérieur de l'œil. Une méthode efficace est l'angiographie par tomographie par cohérence optique (OCTA), qui capture des images des vaisseaux sanguins dans la rétine et la choroïde, offrant des infos que les méthodes d'imagerie traditionnelles ne peuvent pas. L'OCTA est non invasive et plus rapide que d'autres formes d'angiographie, qui nécessitent souvent des injections de colorant. Bien qu'il y ait beaucoup de recherches sur les anciennes méthodes d'imagerie, il y a un manque quand il s'agit d'utiliser l'intelligence artificielle (IA) et l'apprentissage automatique (AA) pour analyser les images OCTA.
Le Défi
Un gros obstacle à l'application de l'Apprentissage profond aux images OCTA est le manque de données étiquetées. Cette limite empêche les modèles IA d'apprendre de manière efficace. En apprentissage automatique, un modèle est formé sur des exemples étiquetés pour faire des prédictions sur de nouvelles données non vues. S'il n'y a pas assez d'exemples à apprendre, le modèle a du mal à généraliser ses résultats à de nouvelles images.
Pour résoudre ce problème, les chercheurs peuvent utiliser une technique appelée Apprentissage Actif. Cela consiste à choisir les points de données les plus pertinents pour le modèle, au lieu d'essayer de l'entraîner avec toutes les données disponibles. En se concentrant sur les exemples les plus difficiles, le modèle peut apprendre plus efficacement et mieux performer dans sa tâche.
Ce Qu'on a Fait
Dans cette recherche, on a étudié comment l'apprentissage profond peut aider à identifier les maladies des yeux en utilisant des images OCTA. On a utilisé un jeu de données spécifique appelé OCTA500, qui se compose d'images de 200 sujets, chacun fournissant plusieurs scans de ses yeux. Cependant, ce jeu de données est très déséquilibré, ce qui signifie qu'il y a beaucoup plus d'images d'yeux sains que d'yeux malades. Ça rend difficile pour le modèle d'apprendre à quoi ressemble un œil malade.
Pour améliorer les performances du modèle, on a mis en place des stratégies d'apprentissage actif. On a utilisé un type standard de modèle de deep learning connu sous le nom de réseau de neurones convolutif. Avec cette approche, on visait à améliorer la capacité du modèle à reconnaître et à classer différentes conditions oculaires.
L'Apprentissage Actif Expliqué
L'apprentissage actif est particulièrement utile quand on travaille avec de grands Jeux de données et peu d'exemples étiquetés. Dans ce cas, on a commencé avec un petit ensemble de données étiquetées pour entraîner notre modèle. Une fois formé, le modèle a classé d'autres images non étiquetées et a fourni un score d'incertitude pour chaque prédiction. Ces scores nous aident à identifier quels exemples le modèle a du mal à classer. En se concentrant sur ces cas difficiles, on peut prioriser les images à étiqueter ensuite.
Notre approche d'apprentissage actif a également inclus deux méthodes d'échantillonnage : l'échantillonnage d'instances et l'échantillonnage de sujets. L'échantillonnage d'instances considère des images individuelles, tandis que l'échantillonnage de sujets regroupe des images par le même patient. On a découvert que l'échantillonnage de sujets donnait de meilleurs résultats car il évite la confusion quand le modèle voit plusieurs images d'un même patient dans les ensembles d'entraînement et de validation.
Comment On a Testé Nos Méthodes
On a mis nos méthodes à l'épreuve en comparant nos stratégies d'apprentissage actif avec des approches traditionnelles. Par exemple, on a essayé d'équilibrer le jeu de données en utilisant des techniques comme le poids de classe par fréquence inverse, où les classes moins fréquentes reçoivent plus de poids dans le calcul de la perte. On a aussi essayé le sous-échantillonnage aléatoire, où on a réduit le nombre d'images saines pour correspondre au nombre d'images malades.
Malgré ces efforts, on a découvert que les stratégies d'apprentissage actif ont surpassé toutes les méthodes conventionnelles qu'on a testées. La performance du modèle s'est significativement améliorée quand on a utilisé des techniques d'apprentissage actif, atteignant des gains de près de 50 % en termes de précision et de performance de classification, mesurés par le score F1, par rapport à la base non équilibrée.
Résultats des Expériences
On a vu des résultats cohérents quand on a analysé les effets de différentes stratégies d'échantillonnage pendant l'apprentissage actif. La méthode basée sur les sujets donne généralement de meilleures performances que les méthodes basées sur les instances, car elle empêche le modèle de devenir trop confiant dans ses prédictions. On a aussi examiné comment le nombre d'images déplacées pendant chaque itération d'apprentissage actif impactait la performance, constatant que moins d'images fonctionnent mieux pour l'échantillonnage de sujets.
Calibrer le modèle était aussi crucial. La calibration consiste à ajuster la sortie du modèle pour donner une représentation plus précise de sa confiance dans ses prédictions. On a appris que certaines méthodes d'estimation d'incertitude bénéficiaient de la calibration, en particulier lorsqu'on utilise l'échantillonnage par entropie, qui prend en compte tous les résultats possibles plutôt que seulement les plus probables.
Conclusion
En résumé, on a montré que juste appliquer des méthodes de deep learning aux images OCTA ne suffit pas à obtenir de bons résultats. Les limites des données étiquetées et le déséquilibre dans le jeu de données peuvent freiner la capacité du modèle à bien performer. En utilisant des stratégies d'apprentissage actif et en se concentrant sur les cas difficiles à classifier, on a réussi à améliorer significativement les performances du modèle dans l'identification des maladies rétiniennes.
Les recherches futures peuvent encore affiner notre approche d'apprentissage actif. Cela pourrait impliquer de développer des stratégies qui garantissent la diversité parmi les exemples sélectionnés et d'explorer des méthodes hybrides combinant différentes techniques. De plus, examiner comment expliquer les prédictions du modèle et identifier les marqueurs d'imagerie clés dans les images OCTA peut améliorer la compréhension globale de ces maladies.
En améliorant notre capacité à détecter tôt les maladies des yeux, on peut potentiellement sauver beaucoup de gens des conséquences dévastatrices de la perte de vision. Cette recherche pose les bases d'applications plus avancées de l'IA dans le domaine de l'ophtalmologie, menant à de meilleurs outils de diagnostic et à une meilleure prise en charge des patients.
Titre: Enhancing Retinal Disease Classification from OCTA Images via Active Learning Techniques
Résumé: Eye diseases are common in older Americans and can lead to decreased vision and blindness. Recent advancements in imaging technologies allow clinicians to capture high-quality images of the retinal blood vessels via Optical Coherence Tomography Angiography (OCTA), which contain vital information for diagnosing these diseases and expediting preventative measures. OCTA provides detailed vascular imaging as compared to the solely structural information obtained by common OCT imaging. Although there have been considerable studies on OCT imaging, there have been limited to no studies exploring the role of artificial intelligence (AI) and machine learning (ML) approaches for predictive modeling with OCTA images. In this paper, we explore the use of deep learning to identify eye disease in OCTA images. However, due to the lack of labeled data, the straightforward application of deep learning doesn't necessarily yield good generalization. To this end, we utilize active learning to select the most valuable subset of data to train our model. We demonstrate that active learning subset selection greatly outperforms other strategies, such as inverse frequency class weighting, random undersampling, and oversampling, by up to 49% in F1 evaluation.
Auteurs: Jacob Thrasher, Annahita Amireskandari, Prashnna Gyawali
Dernière mise à jour: 2024-07-21 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2407.15293
Source PDF: https://arxiv.org/pdf/2407.15293
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.