Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'image et de la vidéo# Vision par ordinateur et reconnaissance des formes

Améliorer l'étiquetage des images médicales avec M-VAAL

Une nouvelle méthode améliore le processus de labellisation en imagerie médicale.

― 7 min lire


M-VAAL : ÉtiquetageM-VAAL : Étiquetaged'Image Intelligentmédicales.l'efficacité du marquage d'imagesUne nouvelle méthode optimise
Table des matières

Obtenir des images médicales avec les bonnes étiquettes coûte souvent très cher. Ça demande des experts qui prennent beaucoup de temps pour s'assurer que tout est correct. L'Apprentissage Actif est une méthode qui aide à réduire le nombre d'images à étiqueter en choisissant seulement les exemples les plus utiles pour que les experts les examinent. Ces exemples utiles peuvent vraiment améliorer le fonctionnement de l'apprentissage machine, ce qui est important pour diagnostiquer des problèmes de santé et planifier des traitements.

Même s'il existe des méthodes qui essaient de choisir les meilleures images pour l'étiquetage en Analyse d'images médicales, beaucoup ne fonctionnent pas pour différents types de tâches. Elles passent souvent à côté d'autres infos utiles qui pourraient renforcer le processus. Du coup, une nouvelle méthode appelée Multimodal Variational Adversarial Active Learning (M-VAAL) a été créée. Cette méthode utilise des détails supplémentaires provenant de différentes informations pour améliorer le choix des images à étiqueter.

Qu'est-ce que l'apprentissage actif ?

L'apprentissage actif est un moyen de sélectionner les images les plus informatives d'un grand groupe qui n'ont pas d'étiquettes. Le but ici est d'améliorer la performance des tâches d'apprentissage machine avec un nombre limité d'échantillons étiquetés. Le processus commence avec quelques images étiquetées, puis on sélectionne des images en les prenant de l'ensemble d'exemples non étiquetés à ajouter à l'ensemble étiqueté. Cette sélection se fait de manière itérative, où les meilleures images sont choisies à chaque fois pour être étiquetées par des experts, et ces nouvelles images étiquetées sont ensuite utilisées pour réentraîner le modèle d'apprentissage machine.

Analyse d'images médicales

L'imagerie médicale implique des méthodes pour prendre des images du corps afin d'aider à diagnostiquer des maladies ou à planifier un traitement. Ces tâches incluent l'identification de caractéristiques dans les images ou la classification de maladies. Ces dernières années, les techniques d'apprentissage profond ont montré de bons résultats dans des applications cliniques. Cependant, l'utilisation de ces modèles dans des contextes de santé réels est souvent limitée car il n'y a pas assez d'accès à un grand nombre d'images étiquetées.

C'est cher d'obtenir des images médicales étiquetées, et certains ont envisagé de créer de fausses images qui viennent avec des étiquettes de vérité de base. Mais ces images générées ne correspondent pas toujours aux images médicales réelles, en particulier dans des cas rares. Cela peut rendre les modèles biaisés et moins performants. Une autre approche qui a gagné de l'intérêt est l'apprentissage semi-supervisé. Cette méthode utilise quelques images étiquetées avec beaucoup d'images non étiquetées, mais elle a encore besoin que des images spécifiques soient choisies pour que les experts les annotent.

Comment fonctionne M-VAAL ?

M-VAAL vise à améliorer le processus en utilisant des informations provenant de plusieurs types d'images. Dans le domaine médical, les médecins ne se contentent pas de regarder une seule image ; ils tiennent aussi compte d'autres rapports et informations sur l'état du patient. En utilisant ces infos supplémentaires, M-VAAL améliore le processus de sélection pour l'apprentissage actif.

Dans cette approche, deux tâches principales sont réalisées : d'abord, un apprenant de tâche est construit pour entraîner des modèles d'apprentissage machine en utilisant les échantillons étiquetés, et ensuite, un échantillonneur choisit les meilleures images à étiqueter. En combinant divers types d'images, M-VAAL peut prendre de meilleures décisions sur lesquelles images non étiquetées choisir.

Analyse des tumeurs cérébrales et des radiographies thoraciques

L'efficacité de M-VAAL a été testée sur deux types de jeux de données : un axé sur les tumeurs cérébrales et l'autre sur les images de radiographies thoraciques.

Segmentation des tumeurs cérébrales

Dans la tâche des tumeurs cérébrales, des images ont été prises en utilisant différents protocoles qui fournissaient des coupes de divers types d'images IRM. L'objectif était de trouver et d'étiqueter différentes parties des tumeurs dans ces images en fonction de certaines caractéristiques. Le jeu de données sur les tumeurs cérébrales a été divisé en cas d'entraînement, de validation et de test, en veillant à ne pas laisser filtrer les infos des patients.

Classification des radiographies thoraciques

Le jeu de données des radiographies thoraciques comprenait des images classées en trois catégories : infection COVID, infection Non-COVID et Normal. Ces images sont accompagnées d'un masque identifiant les segments dans les images. Le but était de classifier correctement les images de radiographies thoraciques dans ces catégories en utilisant l'approche M-VAAL.

Évaluation des performances

La performance de M-VAAL a été comparée à deux autres méthodes : l'échantillonnage aléatoire et une méthode précédente appelée VAAL. Les résultats étaient prometteurs, montrant que M-VAAL sélectionnait des échantillons plus utiles pour les tâches de segmentation des tumeurs cérébrales et de classification des radiographies thoraciques.

Scores de segmentation

L'analyse s'est concentrée sur la performance de M-VAAL dans la segmentation des tumeurs cérébrales par rapport aux autres méthodes. M-VAAL a fourni de meilleurs résultats, surtout quand il y avait moins d'échantillons étiquetés. Cela a montré que M-VAAL peut tirer parti des données non étiquetées efficacement et fournir presque les mêmes performances que lorsqu'il est entièrement entraîné.

Classification multi-étiquettes

Dans la classification multi-étiquettes pour les types de tumeurs, M-VAAL a surpassé les autres méthodes en termes de précision moyenne, surtout en travaillant avec moins d'échantillons d'entraînement. Ça veut dire que tous les échantillons ne contribuent pas de manière égale au processus d'apprentissage ; choisir les bons a son importance.

Classification multi-classes

La performance de classification a également été vérifiée pour les images de radiographies thoraciques. M-VAAL a constamment fait mieux que les autres méthodes. Bien que la précision globale ait augmenté avec l'augmentation des échantillons étiquetés, M-VAAL a montré sa capacité à rester efficace même avec moins d'échantillons.

Plans futurs

L'objectif maintenant est de continuer à améliorer M-VAAL. D'autres évaluations seront menées sur de plus grandes quantités de données médicales non étiquetées, en se concentrant sur différents types d'images. Le potentiel d'utiliser différentes formes d'informations, comme les données de profondeur, peut aussi être exploré pour améliorer le processus d'échantillonnage dans diverses tâches médicales.

Conclusion

M-VAAL est une méthode utile pour améliorer la sélection des échantillons à étiqueter en analyse d'images médicales. En utilisant diverses formes de données, ça montre une tendance positive vers un apprentissage actif plus efficace. Le besoin de données bien étiquetées est crucial, et cette approche ouvre une nouvelle direction pour les chercheurs et praticiens dans le domaine médical, rendant le processus d'apprentissage moins intense tout en atteignant de bonnes performances. Les ajustements continus des hyperparamètres amélioreront le succès de cette méthode dans des applications réelles.

Source originale

Titre: M-VAAL: Multimodal Variational Adversarial Active Learning for Downstream Medical Image Analysis Tasks

Résumé: Acquiring properly annotated data is expensive in the medical field as it requires experts, time-consuming protocols, and rigorous validation. Active learning attempts to minimize the need for large annotated samples by actively sampling the most informative examples for annotation. These examples contribute significantly to improving the performance of supervised machine learning models, and thus, active learning can play an essential role in selecting the most appropriate information in deep learning-based diagnosis, clinical assessments, and treatment planning. Although some existing works have proposed methods for sampling the best examples for annotation in medical image analysis, they are not task-agnostic and do not use multimodal auxiliary information in the sampler, which has the potential to increase robustness. Therefore, in this work, we propose a Multimodal Variational Adversarial Active Learning (M-VAAL) method that uses auxiliary information from additional modalities to enhance the active sampling. We applied our method to two datasets: i) brain tumor segmentation and multi-label classification using the BraTS2018 dataset, and ii) chest X-ray image classification using the COVID-QU-Ex dataset. Our results show a promising direction toward data-efficient learning under limited annotations.

Auteurs: Bidur Khanal, Binod Bhattarai, Bishesh Khanal, Danail Stoyanov, Cristian A. Linte

Dernière mise à jour: 2023-06-21 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2306.12376

Source PDF: https://arxiv.org/pdf/2306.12376

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires