Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Elektrotechnik und Systemtechnik# Bild- und Videoverarbeitung# Computer Vision und Mustererkennung# Maschinelles Lernen

Herausforderung der Brustdichte bringt KI-Techniken voran

Eine globale Herausforderung hebt das föderierte Lernen zur Klassifizierung der Brustdichte hervor.

― 7 min Lesedauer


KI-HerausforderungKI-Herausforderungverbessert die Analyseder BrustdichteBrustkrebsfrüherkennung.Einsatz von KI bei derInnovativer Wettbewerb fördert den
Inhaltsverzeichnis

Brustdichte ist ein wichtiges Kriterium, um das Risiko für Brustkrebs zu bestimmen. Zu verstehen, wie dichte Brustgewebe Tumore verdecken kann, ist entscheidend für die Risikobewertung von Patienten und die Planung ihrer zukünftigen Screenings. Künstliche Intelligenz (KI) hat vielversprechende Ergebnisse bei der genauen Vorhersage von Brustdichte gezeigt, aber die Herausforderung kommt durch die unterschiedlichen Arten von Mammographiegeräten, die an verschiedenen Standorten verwendet werden. Modelle, die auf einem Typ von Mammographiedaten trainiert wurden, schneiden bei Daten von einem anderen Gerätetyp nicht so gut ab. Um das anzugehen, hat sich föderiertes Lernen (FL) als Methode entwickelt, die es ermöglicht, KI-Modelle mit Daten von mehreren Standorten zu trainieren, ohne dass Daten geteilt werden müssen. Dieser Ansatz wird noch erforscht, um die besten Wege zu finden, um wichtige Merkmale aus allen Trainingsdaten zu bewahren.

Um FL-Techniken zu untersuchen, wurde ein Wettbewerb zur Klassifizierung der Brustdichte veranstaltet. Dieses Event war eine Zusammenarbeit zwischen akademischen Institutionen und Tech-Unternehmen. Die Teilnehmer reichten Algorithmen ein, die FL auf simulierten medizinischen Daten aus verschiedenen Einrichtungen durchführen konnten, jede mit ihrem eigenen grossen Datensatz von Mammogrammen. Der Wettbewerb fand von Mitte Juni bis Anfang September 2022 statt und zog zahlreiche Teilnehmer weltweit an. Die beste Einreichung erzielte einen bemerkenswerten Punktestand, der auf ein Leistungsniveau hinweist, das dem eines Modells ähnelt, das auf einem einzigen, zentralisierten Datensatz trainiert wurde.

Bedeutung der genauen Klassifizierung der Brustdichte

Die genaue Bestimmung der Brustdichte aus Mammogrammen ist entscheidend für die Bewertung des Brustkrebsrisikos. Dichtes Brustgewebe kann Tumore verdecken, was die frühzeitige Erkennung von Krebs erschwert. Allerdings hat diese Klassifizierungsaufgabe eine hohe Variabilität, da unterschiedliche Radiologen die Bilder unterschiedlich interpretieren können. Obwohl einige KI-Modelle die Brustdichte mit hoher Genauigkeit klassifizieren können, schneiden Mammogramme von verschiedenen Bildgebungssystemen oder Populationen, die nicht im Modelltraining enthalten sind, oft schlecht ab. Das ist besonders relevant, da sich die Bildgebungstechnologie verbessert und Modelle in verschiedenen medizinischen Situationen eingesetzt werden.

Aufgrund der sensiblen Natur medizinischer Daten ist FL eine beliebte Methode geworden, um KI-Algorithmen zu trainieren, während die Patientendaten sicher bleiben. Beim FL findet das Training lokal an verschiedenen Einrichtungen statt, sodass die Daten vor Ort bleiben können. Nur notwendige Informationen darüber, wie die lokalen Modelle abschneiden, werden geteilt, um ein kombiniertes Modell zu erstellen, das in verschiedenen Datensätzen besser abschneiden sollte.

FL-Modelle haben sich in verschiedenen medizinischen Situationen als effektiver erwiesen als Modelle, die auf Daten aus einer einzigen Institution trainiert wurden, einschliesslich der Klassifizierung der Brustdichte, der Vorhersage von COVID-19-Behandlungsergebnissen und der Segmentierung von Hirntumoren. Es gibt jedoch laufende Forschungen, um die effektivsten Wege zum Training dieser Modelle zu bestimmen und wie man die Daten aus mehreren Quellen während dieses Prozesses verwaltet.

Überblick über die Brustdichte-FL-Herausforderung

Die Brustdichte-FL-Herausforderung fand in einer sicheren Umgebung statt, die von einer grossen Organisation in der Radiologie eingerichtet wurde. Interessierte Teilnehmer konnten sich über die Wettbewerbsregeln informieren und sich über eine öffentliche Website registrieren. Nach Genehmigung erhielten die Teilnehmer Zugang zu einem privaten Bereich, wo sie ihre Einreichungen abgeben konnten.

Das Ziel war, dass die Teilnehmer FL-Algorithmen entwickeln, die die Brustdichte in Mammogrammen genau klassifizieren können. Sie konnten vortrainierte Modelle nutzen, um bei ihren Einreichungen zu helfen. Das Organisationsteam nahm nicht am Wettbewerb teil, sondern konzentrierte sich darauf, die Veranstaltung zu unterstützen.

Die Einreichungen bestanden aus gezippten Dateien mit Anweisungen zur Einrichtung automatisierter FL-Durchläufe. Der Wettbewerb war in zwei Teile gegliedert. Der erste Teil konzentrierte sich auf das Trainieren der Algorithmen und erlaubte den Teilnehmern eine begrenzte Anzahl von Einreichungen pro Tag. Der zweite Teil testete die letzte Einreichung jedes Teilnehmers auf einem separaten Datensatz. Nach der ersten Phase wurden Rückmeldungen von den Teilnehmern über ihre Erfahrungen und Ansätze gesammelt.

Architektur und Werkzeuge der Herausforderung

Die Architektur der Herausforderung bestand aus mehreren virtuellen Maschinen, die für bestimmte Funktionen ausgelegt waren. Eine Maschine verarbeitete die Wettbewerbsbeiträge, eine koordinierte die FL-Durchläufe über die verschiedenen Teilnehmereinreichungen, und andere beherbergten die einzigartigen Datensätze, die für das Training verwendet wurden.

Die Teilnehmer interagierten mit der Wettbewerbsumgebung über eine Webplattform, die zur Unterstützung von Wettbewerben im Bereich maschinelles Lernen entwickelt wurde. Sie konnten Dateien mit ihren Algorithmen einreichen, die dann aus Sicherheitsgründen manuell überprüft wurden. Danach wurden die Algorithmen innerhalb des FL-Setups kompiliert und getestet.

Der FL-Server verwaltete die Einreichungen über die verschiedenen Clientmaschinen, von denen jede unabhängig mit ihren einzigartigen Datensätzen arbeitete. Die Teilnehmer waren in ihren Rechenressourcen nicht eingeschränkt, was es ihnen ermöglichte, sich auf die Entwicklung ihrer Algorithmen ohne technische Einschränkungen zu konzentrieren.

Daten, die in der Herausforderung verwendet wurden

Die Datensätze, die in der Herausforderung verwendet wurden, stammten aus einer umfangreichen Mammographiestudie. Für den Zugriff auf diesen Datensatz waren spezifische Genehmigungen erforderlich, sodass die Teilnehmer die Originaldaten nicht direkt erhielten. Stattdessen wurde ihnen ein Beispiel-Datensatz zur Verfügung gestellt.

Die Herausforderung beinhaltete Mammogramme, die mit einer von vier Kategorien gekennzeichnet waren, die die Brustdichte beschreiben. Die Verteilung dieser Labels variierte über die verschiedenen Datensätze, die von den Teilnehmern verwendet wurden. Kennzahlen wurden erstellt, um zu bewerten, wie gut die Algorithmen bei der Klassifizierung der Brustdichte auf Basis dieser Labels abschnitten.

Bewertung der Einreichungen

Nach Abschluss der Herausforderung wurde die Leistung der Algorithmen mit verschiedenen Kennzahlen bewertet, um ihre Effektivität bei der Klassifizierung der Brustdichte zu messen. Die Ergebnisse des Wettbewerbs wurden auf einer Konferenz geteilt, wobei die beste Einreichung für ihre Leistung ausgezeichnet wurde.

Nachdem die Phase-II-Einreichungen an einem externen Validierungsdatensatz getestet wurden, konnten die Teilnehmer sehen, wie ihre Algorithmen auf einem neuen Datensatz abschnitten, der während ihres Trainings nicht gesehen wurde. Durch diese Analyse wurde die Leistung der Algorithmen im Vergleich zu anderen relevanten Modellen bewertet, um deren Effektivität besser zu verstehen.

Analyse von demografischen Vorurteilen

Die Herausforderung beinhaltete auch eine Untersuchung demografischer Faktoren, die die Leistung der Algorithmen beeinflussen könnten. Zum Beispiel wurde die Leistung über verschiedene ethnische und Altersgruppen hinweg analysiert, um zu sehen, ob die Modelle unabhängig von diesen Faktoren gleich gut funktionierten.

Es wurde festgestellt, dass einige demografische Gruppen niedrigere Leistungsraten aufwiesen, was wahrscheinlich mit der Grösse der Trainingsdaten für diese Gruppen zusammenhängt. Dies verdeutlichte die Notwendigkeit weiterer Forschung, um KI-Modelle gerechter und effektiver für alle Bevölkerungsgruppen zu gestalten.

Wichtige Erkenntnisse und zukünftige Überlegungen

Die Brustdichte-FL-Herausforderung lieferte wertvolle Einblicke in die Methoden des föderierten Lernens. Sie etablierte einen Rahmen für ähnliche zukünftige Wettbewerbe, bei denen sensible Daten sicher bleiben können, während faire Vergleiche zwischen KI-Algorithmen ermöglicht werden.

Die Ergebnisse zeigten, dass FL-Algorithmen im Allgemeinen gut abschnitten, aber es deutlichere Rückgänge in der Effektivität gab, wenn sie an externen Datensätzen evaluiert wurden, insbesondere für unterrepräsentierte demografische Gruppen. Diese Erkenntnis weist auf die Notwendigkeit laufender Forschung hin, um KI-Modelle zu schaffen, die fair und unvoreingenommen sind.

Während mehrere Teams vortrainierte Modelle nutzten, um ihre Einreichungen zu verbessern, führten nicht alle Ansätze zu gleich erfolgreichen Ergebnissen. Einige Algorithmen zeigten, dass ein globales Modell für die Verallgemeinerung von Vorteil war, während andere Teams sich nur auf lokale Modelle konzentrierten.

Insgesamt hat die Herausforderung das Potenzial von FL in der medizinischen KI demonstriert und hervorgehoben, wie wichtig Datenvielfalt im Training von Algorithmen ist. Sie ermutigt zukünftige Studien, sich darauf zu konzentrieren, KI-Modelle zu entwickeln, die alle Patienten genau und gerecht bedienen können.

Abschliessende Gedanken

Die Brustdichte-FL-Herausforderung war erfolgreich darin, globale Teilnehmer anzuziehen und bedeutende Erkenntnisse zur Methodik des föderierten Lernens zu liefern. Dieser Erfolg kann als Modell für zukünftige KI-Wettbewerbe dienen, die faire Bewertungen anstreben, ohne dass die Teilnehmer direkt auf sensible Daten zugreifen müssen.

Die Ergebnisse der Herausforderung plädieren für kontinuierliche Verbesserungen bei KI-Modellen, die in Gesundheitssettings verwendet werden, und betonen die Bedeutung der Entwicklung von Algorithmen, die sich an unterschiedliche Patientengruppen und verschiedene Datenquellen anpassen können. Zukünftige Forschung sollte darauf abzielen, diese Technologien zu verfeinern, um sicherzustellen, dass sie effektive Unterstützung für genaue Diagnosen bieten, während sie sensibel für Fragen der Fairness und Repräsentation sind.

Originalquelle

Titel: Fair Evaluation of Federated Learning Algorithms for Automated Breast Density Classification: The Results of the 2022 ACR-NCI-NVIDIA Federated Learning Challenge

Zusammenfassung: The correct interpretation of breast density is important in the assessment of breast cancer risk. AI has been shown capable of accurately predicting breast density, however, due to the differences in imaging characteristics across mammography systems, models built using data from one system do not generalize well to other systems. Though federated learning (FL) has emerged as a way to improve the generalizability of AI without the need to share data, the best way to preserve features from all training data during FL is an active area of research. To explore FL methodology, the breast density classification FL challenge was hosted in partnership with the American College of Radiology, Harvard Medical School's Mass General Brigham, University of Colorado, NVIDIA, and the National Institutes of Health National Cancer Institute. Challenge participants were able to submit docker containers capable of implementing FL on three simulated medical facilities, each containing a unique large mammography dataset. The breast density FL challenge ran from June 15 to September 5, 2022, attracting seven finalists from around the world. The winning FL submission reached a linear kappa score of 0.653 on the challenge test data and 0.413 on an external testing dataset, scoring comparably to a model trained on the same data in a central location.

Autoren: Kendall Schmidt, Benjamin Bearce, Ken Chang, Laura Coombs, Keyvan Farahani, Marawan Elbatele, Kaouther Mouhebe, Robert Marti, Ruipeng Zhang, Yao Zhang, Yanfeng Wang, Yaojun Hu, Haochao Ying, Yuyang Xu, Conrad Testagrose, Mutlu Demirer, Vikash Gupta, Ünal Akünal, Markus Bujotzek, Klaus H. Maier-Hein, Yi Qin, Xiaomeng Li, Jayashree Kalpathy-Cramer, Holger R. Roth

Letzte Aktualisierung: 2024-05-22 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2405.14900

Quell-PDF: https://arxiv.org/pdf/2405.14900

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel