Faire avancer la classification des images médicales avec le jeu de données MedFMC
Présentation de MedFMC, un jeu de données qui améliore la classification des images médicales pour un meilleur diagnostic.
― 7 min lire
Table des matières
La classification d'images médicales est super importante pour diagnostiquer des maladies et orienter les traitements. Mais pour entraîner des modèles qui analysent des images médicales, il faut un gros volume de données publiques, ce qui est souvent limité. Cet article parle d'un nouveau jeu de données appelé MedFMC, qui a pour but d'aider les chercheurs à adapter des modèles existants pour la classification d'images médicales en fournissant un ensemble diversifié d'images cliniques réelles.
Contexte
Dernièrement, des modèles avancés ont été pré-entraînés sur d'énormes ensembles de données et peuvent être adaptés pour des tâches spécifiques avec moins d'échantillons. Cette technique s'appelle l'apprentissage avec peu d'exemples. Même si ça marche bien pour l'imagerie générale et les tâches linguistiques, son utilisation en imagerie médicale est minimale à cause du manque de données publiques.
Obtenir des images médicales de haute qualité avec des annotations détaillées est compliqué, car ça demande souvent l'intervention de professionnels de la santé. Beaucoup de jeux de données existants se concentrent sur des tâches uniques, ce qui complique l'analyse de leur efficacité dans différentes applications d'imagerie médicale. Du coup, il y a un vrai besoin de développer de meilleurs ensembles de données et benchmarks pour évaluer les performances des techniques d'adaptation en analyse d'images médicales.
Le jeu de données MedFMC
Le jeu de données MedFMC collecte des images médicales pour plusieurs tâches. Il inclut 22 349 images provenant de divers scénarios cliniques. Ces tâches couvrent différentes conditions, notamment :
- Dépistage des maladies thoraciques avec des radiographies
- Identification des lésions dans les images de pathologie
- Détection des lésions dans les images d'endoscopie
- Évaluation de la jaunisse néonatale
- Classification de la rétinopathie diabétique
Ce jeu de données a été compilé à partir de plusieurs hôpitaux et institutions médicales, garantissant une large représentation de différents scénarios médicaux.
Collecte de données d'images
Les images du jeu de données MedFMC proviennent de cinq modalités d'imagerie médicale différentes. Ça inclut :
- Radiographies thoraciques : Utilisées pour dépister des maladies thoraciques courantes. Le sous-ensemble ChestDR contient 4 848 images de patients avec diverses conditions. 
- Images de pathologie : Le sous-ensemble ColonPath inclut 10 009 échantillons de tissus pour aider à identifier les cellules cancéreuses dans des petits échantillons. 
- Photos de peau pour la jaunisse : Le sous-ensemble NeoJaundice se compose de 2 235 images de la peau des bébés pour évaluer la jaunisse sans tests sanguins invasifs. 
- Images de coloscopie : Le jeu Endo contient 3 865 images d'examens de coloscopie visant à détecter des lésions liées au cancer colorectal. 
- Images rétiniennes : Le jeu Retino a 1 392 images de fond d'œil pour classifier la rétinopathie diabétique, ce qui est crucial pour prévenir la perte de vision chez les patients diabétiques. 
Processus d'annotation
L'annotation des images médicales demande Précision et minutie. Chaque image du jeu de données MedFMC a subi un processus d'annotation strict en deux étapes :
- Étiquetage initial : Des stagiaires médicaux ou des professionnels juniors ont créé des étiquettes initiales basées sur des rapports existants ou des prédictions automatisées. 
- Vérification : Des professionnels seniors ont examiné et confirmé ces étiquettes pour garantir leur fiabilité. Cette approche à deux niveaux aide à maintenir des annotations de haute qualité. 
Apprentissage par peu d'exemples
L'apprentissage par peu d'exemples est une technique qui permet aux modèles d'apprendre à partir d'un faible nombre d'exemples. C'est crucial en imagerie médicale, où de nombreuses conditions ont des données limitées. La conception du jeu de données MedFMC encourage l'application de méthodes d'apprentissage par peu d'exemples à travers diverses tâches médicales.
La structure du jeu de données facilite le test de différents modèles avec des quantités variées de données d'entraînement. En comparant les performances sur plusieurs tâches, les chercheurs peuvent évaluer comment les modèles s'adaptent à de nouvelles informations.
Métriques d'évaluation
Pour évaluer l'efficacité des modèles utilisant le jeu de données MedFMC, plusieurs métriques clés sont employées :
- Précision (Acc) : Mesure combien de prédictions le modèle fait correctement sur toutes les images d'échantillon. 
- Aire sous la courbe (AUC) : Évalue la capacité du modèle à distinguer les classes positives et négatives à différents seuils. 
- Précision moyenne (mAP) : Cette métrique est particulièrement utile dans les tâches multi-label, en regroupant la précision de toutes les classes. 
Ces métriques aident les chercheurs à identifier quels modèles fonctionnent le mieux dans différents scénarios et comment ils s'adaptent efficacement à de nouvelles données.
Résultats et discussion
Les premières expériences avec le jeu de données MedFMC montrent des résultats prometteurs à travers différentes méthodes d'apprentissage. Le jeu de données permet de tester plusieurs modèles, y compris des techniques d'apprentissage profond traditionnelles et les nouvelles méthodes d'apprentissage par peu d'exemples.
Lors des premières évaluations, les modèles utilisant des techniques d'apprentissage par peu d'exemples semblent exceller dans les scénarios où les méthodes traditionnelles peinent, surtout dans les cas avec peu de données d'entraînement. Les résultats montrent que ces méthodes sont adaptées à l'analyse d'images médicales, surtout pour les maladies rares où les données sont rares.
Malgré ces succès, des défis persistent. Les modèles peuvent avoir du mal avec le surajustement, surtout quand ils sont entraînés avec très peu d'exemples. Donc, les travaux futurs aborderont ces problèmes, cherchant des moyens d'améliorer l'entraînement des modèles et leur performance avec peu de données.
Directions futures
Le potentiel du jeu de données MedFMC va au-delà des résultats initiaux. Les recherches futures vont probablement explorer les domaines suivants :
- Élargir les types de données : Un travail futur pourrait inclure d'autres modalités d'imagerie ou conditions de patients pour élargir le jeu de données. 
- Imagerie 3D : Investiguer les tâches d'imagerie médicale en 3D peut compléter le focus actuel sur le 2D, fournissant des outils de diagnostic plus complets. 
- Intégration dans les flux de travail cliniques : Comprendre comment ces modèles peuvent être intégrés efficacement dans des situations cliniques réelles sera crucial pour leur utilisation pratique. 
- Techniques d'apprentissage par peu d'exemples améliorées : Alors que les chercheurs continuent à affiner les méthodes d'apprentissage par peu d'exemples, de nouvelles techniques pourraient encore améliorer la performance des modèles sur les données médicales. 
- Améliorer la généralisabilité : Continuer à évaluer comment les modèles entraînés sur le jeu de données MedFMC peuvent s'adapter à de nouvelles données non vues sera un objectif principal. 
Conclusion
Le jeu de données MedFMC est un pas en avant important dans le domaine de la classification d'images médicales. Il fournit des ressources précieuses pour aider les chercheurs à adapter des modèles existants à diverses tâches cliniques, notamment en utilisant des méthodes d'apprentissage par peu d'exemples. Alors que le jeu de données et ses applications continuent d'évoluer, il promet d'améliorer la précision diagnostique et l'efficacité dans la pratique médicale.
Titre: MedFMC: A Real-world Dataset and Benchmark For Foundation Model Adaptation in Medical Image Classification
Résumé: Foundation models, often pre-trained with large-scale data, have achieved paramount success in jump-starting various vision and language applications. Recent advances further enable adapting foundation models in downstream tasks efficiently using only a few training samples, e.g., in-context learning. Yet, the application of such learning paradigms in medical image analysis remains scarce due to the shortage of publicly accessible data and benchmarks. In this paper, we aim at approaches adapting the foundation models for medical image classification and present a novel dataset and benchmark for the evaluation, i.e., examining the overall performance of accommodating the large-scale foundation models downstream on a set of diverse real-world clinical tasks. We collect five sets of medical imaging data from multiple institutes targeting a variety of real-world clinical tasks (22,349 images in total), i.e., thoracic diseases screening in X-rays, pathological lesion tissue screening, lesion detection in endoscopy images, neonatal jaundice evaluation, and diabetic retinopathy grading. Results of multiple baseline methods are demonstrated using the proposed dataset from both accuracy and cost-effective perspectives.
Auteurs: Dequan Wang, Xiaosong Wang, Lilong Wang, Mengzhang Li, Qian Da, Xiaoqiang Liu, Xiangyu Gao, Jun Shen, Junjun He, Tian Shen, Qi Duan, Jie Zhao, Kang Li, Yu Qiao, Shaoting Zhang
Dernière mise à jour: 2023-06-15 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2306.09579
Source PDF: https://arxiv.org/pdf/2306.09579
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.
Liens de référence
- https://www.nature.com/scientificdata
- https://digestpath2019.grand-challenge.org/Dataset/
- https://zenodo.org/record/1214456#.Y6GIV3ZBxPY
- https://journals.plos.org/plosmedicine/article/file?id=10.1371/journal.pmed.1002730&type=printable
- https://pubmed.ncbi.nlm.nih.gov/34403452/
- https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/FCBUOR
- https://www.depeca.uah.es/colonoscopy_dataset/
- https://github.com/nkicsl/OIA
- https://github.com/nkicsl/DDR-dataset
- https://drive.google.com/drive/folders/1z6tSFmxW_aNayUqVxx6h6bY4kwGzUTEC
- https://www.kaggle.com/competitions/diabetic-retinopathy-detection/data
- https://www.fc.up.pt/addi/ph2%20database.html
- https://github.com/xpwu95/LDL
- https://wiki.cancerimagingarchive.net/pages/viewpage.action?pageId=70230508
- https://github.com/M3DV/ACSConv
- https://github.com/wllfore/MedFMC_fewshot_baseline
- https://doi.org/10.1007/s12110-009-9068-2