Fortschritte bei der Klassifizierung medizinischer Bilder mit dem MedFMC-Datensatz
Wir stellen MedFMC vor, ein Datensatz, der die Klassifizierung von medizinischen Bildern verbessert, um bessere Diagnosen zu ermöglichen.
― 5 min Lesedauer
Inhaltsverzeichnis
Die Klassifikation von medizinischen Bildern ist super wichtig, um Krankheiten zu diagnostizieren und Behandlungen zu leiten. Allerdings braucht man zum Trainieren von Modellen, die medizinische Bilder analysieren, riesige Mengen an öffentlichen Daten, die oft begrenzt sind. In diesem Paper wird ein neuer Datensatz namens MedFMC vorgestellt, der Forschern helfen soll, bestehende Modelle für die Klassifikation von medizinischen Bildern anzupassen, indem er eine vielfältige Sammlung von echten klinischen Bildern bereitstellt.
Hintergrund
Kürzlich wurden fortschrittliche Modelle auf grossen Datensätzen vortrainiert und können mit weniger Beispielen für spezielle Aufgaben angepasst werden. Diese Technik nennt man Few-Shot Learning. Während dieser Ansatz bei allgemeinen Bild- und Sprachaufgaben gut funktioniert hat, wird er in der medizinischen Bildgebung nur minimal genutzt, da es an öffentlich verfügbaren Daten mangelt.
Hochwertige medizinische Bilder mit detaillierten Anmerkungen zu bekommen, ist eine Herausforderung, da es in der Regel die Mitarbeit von medizinischen Fachkräften erfordert. Viele bestehende Datensätze konzentrieren sich auf einzelne Aufgaben, was es schwieriger macht, ihre Wirksamkeit in verschiedenen Anwendungen der medizinischen Bildgebung zu erkunden. Daher besteht ein dringender Bedarf, bessere Datensätze und Benchmarks zu entwickeln, die die Leistung von Anpassungstechniken in der medizinischen Bildanalyse bewerten können.
Der MedFMC-Datensatz
Der MedFMC-Datensatz sammelt medizinische Bilder für mehrere Aufgaben. Er enthält 22.349 Bilder aus verschiedenen klinischen Szenarien. Diese Aufgaben decken verschiedene Bedingungen ab, darunter:
- Screening auf thorakale Erkrankungen mit Röntgenaufnahmen
- Identifizierung von Läsionen in pathologischen Bildern
- Erkennung von Läsionen in Endoskopiebildern
- Bewertung von Neugeborenen-Gelbsucht
- Einstufung von diabetischer Retinopathie
Dieser Datensatz wurde aus mehreren Krankenhäusern und medizinischen Institutionen zusammengestellt, um eine breite Darstellung verschiedener medizinischer Szenarien sicherzustellen.
Bilddatensammlung
Die Bilder im MedFMC-Datensatz stammen aus fünf verschiedenen medizinischen Bildgebungsmodalitäten. Dazu gehören:
- Röntgenaufnahmen des Brustkorbs: Diese werden zur Untersuchung häufiger thorakaler Erkrankungen verwendet. Der ChestDR-Unterdatensatz enthält 4.848 Röntgenbilder von Patienten mit verschiedenen Erkrankungen. 
- Pathologiebilder: Der ColonPath-Unterdatensatz umfasst 10.009 Gewebepatches, um Krebszellen in kleinen Proben zu identifizieren. 
- Hautfotos für Gelbsucht: Der NeoJaundice-Unterdatensatz besteht aus 2.235 Bildern von der Haut von Säuglingen zur Bewertung von Gelbsucht ohne invasive Bluttests. 
- Koloskopiebilder: Der Endo-Datensatz enthält 3.865 Bilder von Koloskopie-Untersuchungen zur Erkennung von Läsionen, die mit Darmkrebs in Verbindung stehen. 
- Retinalbilder: Der Retino-Datensatz hat 1.392 Fundusbilder zur Einstufung von diabetischer Retinopathie, was entscheidend ist, um Sehverlust bei Diabetikern zu verhindern. 
Annotationsprozess
Die Annotation von medizinischen Bildern erfordert Genauigkeit und Gründlichkeit. Jedes Bild im MedFMC-Datensatz durchlief einen strikten zweistufigen Annotationsprozess:
- Erste Kennzeichnung: Medizinische Trainees oder Junior-Profis erstellten erste Labels basierend auf bestehenden Berichten oder automatisierten Vorhersagen. 
- Überprüfung: Senior-Profis überprüften und bestätigten diese Labels, um die Zuverlässigkeit sicherzustellen. Dieser zweistufige Ansatz hilft, qualitativ hochwertige Anmerkungen zu gewährleisten. 
Few-Shot Learning
Few-Shot Learning ist eine Technik, die es Modellen ermöglicht, aus nur einer kleinen Anzahl von Beispielen zu lernen. Das ist in der medizinischen Bildgebung entscheidend, wo viele Bedingungen nur begrenzte Daten haben. Das Design des MedFMC-Datensatzes fördert die Anwendung von Few-Shot-Methoden über verschiedene medizinische Aufgaben hinweg.
Die Struktur des Datensatzes erleichtert das Testen verschiedener Modelle mit unterschiedlichen Mengen an Trainingsdaten. Durch den Vergleich der Leistung über mehrere Aufgaben hinweg können Forscher beurteilen, wie gut sich die Modelle an neue Informationen anpassen.
Evaluationsmetriken
Um die Effektivität von Modellen, die den MedFMC-Datensatz verwenden, zu bewerten, werden mehrere wichtige Metriken eingesetzt:
- Genauigkeit (Acc): Damit wird gemessen, wie viele Vorhersagen das Modell richtig aus allen Beispielbildern macht. 
- Area Under Curve (AUC): AUC bewertet die Fähigkeit des Modells, zwischen positiven und negativen Klassen über verschiedene Schwellenwerte zu unterscheiden. 
- Mean Average Precision (mAP): Diese Metrik ist besonders nützlich bei Multi-Label-Aufgaben und aggregiert die Präzision aus allen Klassen. 
Diese Metriken helfen Forschern, herauszufinden, welche Modelle in verschiedenen Szenarien am besten abschneiden und wie effizient sie sich an neue Daten anpassen.
Ergebnisse und Diskussion
Erste Experimente mit dem MedFMC-Datensatz zeigen vielversprechende Ergebnisse über verschiedene Lernmethoden hinweg. Der Datensatz erlaubt es, mehrere Modelle zu testen, einschliesslich traditioneller Deep-Learning-Techniken und neuerer Few-Shot-Learning-Methoden.
In frühen Bewertungen tendieren Modelle, die Few-Shot-Learning-Techniken verwenden, dazu, in Szenarien, in denen traditionelle Methoden Schwierigkeiten haben, besonders bei Fällen mit begrenzten Trainingsdaten, besser abzuschneiden. Die Ergebnisse zeigen, dass Few-Shot-Methoden sich gut für die medizinische Bildanalyse eignen, insbesondere bei seltenen Krankheiten, wo Daten knapp sind.
Trotz der Erfolge bleiben Herausforderungen. Modelle können mit Overfitting kämpfen, insbesondere wenn sie mit sehr wenigen Beispielen trainiert werden. Zukünftige Arbeiten werden sich mit diesen Problemen befassen und Wege suchen, das Training und die Leistung der Modelle mit minimalen Daten zu verbessern.
Zukünftige Richtungen
Das Potenzial des MedFMC-Datensatzes reicht über die ersten Ergebnisse hinaus. Zukünftige Forschungen werden wahrscheinlich die folgenden Bereiche erkunden:
- Erweiterung der Datentypen: Zukünftige Arbeiten könnten zusätzliche Bildgebungsmodalitäten oder Patientenzustände einbeziehen, um den Datensatz zu erweitern. 
- 3D-Bildgebung: Die Untersuchung von 3D-medizinischen Bildgebungsaufgaben kann den aktuellen 2D-Fokus ergänzen und umfassendere diagnostische Werkzeuge bieten. 
- Integration in klinische Arbeitsabläufe: Zu verstehen, wie diese Modelle effektiv in reale klinische Umgebungen integriert werden können, wird entscheidend für den praktischen Einsatz sein. 
- Verbesserte Few-Shot-Learning-Techniken: Während die Forscher weiterhin Few-Shot-Learning-Methoden verfeinern, könnten neue Techniken die Modellleistung auf medizinischen Daten weiter verbessern. 
- Steigerung der Generalisierbarkeit: Es wird ein Hauptaugenmerk darauf liegen, wie gut sich auf dem MedFMC-Datensatz trainierte Modelle an neue, unbekannte Daten anpassen können. 
Fazit
Der MedFMC-Datensatz ist ein wichtiger Schritt nach vorn im Bereich der medizinischen Bildklassifikation. Er bietet wertvolle Ressourcen, um Forschern zu helfen, bestehende Modelle für verschiedene klinische Aufgaben anzupassen, insbesondere durch die Verwendung von Few-Shot-Learning-Methoden. Während sich der Datensatz und seine Anwendungen weiterentwickeln, verspricht er, die diagnostische Genauigkeit und Effizienz in der medizinischen Praxis zu verbessern.
Titel: MedFMC: A Real-world Dataset and Benchmark For Foundation Model Adaptation in Medical Image Classification
Zusammenfassung: Foundation models, often pre-trained with large-scale data, have achieved paramount success in jump-starting various vision and language applications. Recent advances further enable adapting foundation models in downstream tasks efficiently using only a few training samples, e.g., in-context learning. Yet, the application of such learning paradigms in medical image analysis remains scarce due to the shortage of publicly accessible data and benchmarks. In this paper, we aim at approaches adapting the foundation models for medical image classification and present a novel dataset and benchmark for the evaluation, i.e., examining the overall performance of accommodating the large-scale foundation models downstream on a set of diverse real-world clinical tasks. We collect five sets of medical imaging data from multiple institutes targeting a variety of real-world clinical tasks (22,349 images in total), i.e., thoracic diseases screening in X-rays, pathological lesion tissue screening, lesion detection in endoscopy images, neonatal jaundice evaluation, and diabetic retinopathy grading. Results of multiple baseline methods are demonstrated using the proposed dataset from both accuracy and cost-effective perspectives.
Autoren: Dequan Wang, Xiaosong Wang, Lilong Wang, Mengzhang Li, Qian Da, Xiaoqiang Liu, Xiangyu Gao, Jun Shen, Junjun He, Tian Shen, Qi Duan, Jie Zhao, Kang Li, Yu Qiao, Shaoting Zhang
Letzte Aktualisierung: 2023-06-15 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2306.09579
Quell-PDF: https://arxiv.org/pdf/2306.09579
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.
Referenz Links
- https://www.nature.com/scientificdata
- https://digestpath2019.grand-challenge.org/Dataset/
- https://zenodo.org/record/1214456#.Y6GIV3ZBxPY
- https://journals.plos.org/plosmedicine/article/file?id=10.1371/journal.pmed.1002730&type=printable
- https://pubmed.ncbi.nlm.nih.gov/34403452/
- https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/FCBUOR
- https://www.depeca.uah.es/colonoscopy_dataset/
- https://github.com/nkicsl/OIA
- https://github.com/nkicsl/DDR-dataset
- https://drive.google.com/drive/folders/1z6tSFmxW_aNayUqVxx6h6bY4kwGzUTEC
- https://www.kaggle.com/competitions/diabetic-retinopathy-detection/data
- https://www.fc.up.pt/addi/ph2%20database.html
- https://github.com/xpwu95/LDL
- https://wiki.cancerimagingarchive.net/pages/viewpage.action?pageId=70230508
- https://github.com/M3DV/ACSConv
- https://github.com/wllfore/MedFMC_fewshot_baseline
- https://doi.org/10.1007/s12110-009-9068-2