Eine neue Methode zur Klassifizierung von Tumorbildern
Diese Methode nutzt partielle Label-Informationen, um die Tumorklassifikation in medizinischen Bildern zu verbessern.
― 5 min Lesedauer
Inhaltsverzeichnis
Die Segmentierung von Tumoren in medizinischen Bildern ist super wichtig, damit Ärzte genaue Diagnosen stellen können. Eine Möglichkeit, diese Bilder zu analysieren, sind Ganzbildbilder (WSI), das sind hochauflösende Bilder von Gewebeproben. In diesem Artikel geht's um einen neuen Ansatz, der teilweise Beschriftungsinformationen nutzt, um diese Bilder in verschiedene Tumorsubtypen und nicht-Tumorgebiete zu klassifizieren.
Was sind Ganzbildbilder?
Ganzbildbilder erfassen die gesamte Gewebeprobe und können viele verschiedene Zelltypen enthalten. Jede Zelle im Bild kann zu einer bestimmten Kategorie gehören, wie zum Beispiel einem Tumorsubtyp oder einer gesunden Zelle. Ärzte müssen oft diese Bilder genau betrachten, um Krebs richtig zu erkennen. Aber die Auflösung von WSIs kann diesen Prozess kompliziert und zeitaufwendig machen.
In einer klinischen Umgebung sammeln Ärzte normalerweise Daten über die Anteile der verschiedenen Tumortypen, die in der Gewebeprobe vorhanden sind. Diese Daten werden aufgezeichnet, auch wenn sie keine Informationen über nicht-tumoröse Zellen enthalten. Das bedeutet, dass Ärzte zwar wissen, wie viel von der Probe aus verschiedenen Tumortypen besteht, aber keine Infos über den nicht-tumorösen Anteil haben.
Die Herausforderung unvollständiger Informationen
In unserem Ansatz bezeichnen wir die Situation, in der nur teilweise Informationen über die Labels vorliegen, als "Lernen aus partiellen Labelproportionen" oder LPLP. Auch wenn Ärzte die Anteile der Tumorsubtypen angeben können, erfassen sie oft nicht, wie viel von der Probe gesunde Gewebe ist. Diese fehlenden Informationen können es schwierig machen, das gesamte Bild genau zu klassifizieren.
Das Problem tritt auf, wenn es darum geht, einen Klassifikator zu trainieren, der diese Bilder verstehen kann. Wenn ein Arzt beispielsweise sagt, dass 70 % des Tumors Subtyp A und 30 % Subtyp B sind, wissen wir dennoch nicht, wie viel von der Gesamtprobe gesundes Gewebe ist.
Nutzung gesunder Proben
Glücklicherweise können gesunde Proben, die keine Tumoren enthalten, sehr nützlich sein. Diese Proben können als Leitfaden dienen, um den Klassifikationsprozess zu unterstützen. Indem wir Bilder verwenden, die völlig gesund sind, können wir besser erkennen, wie ein nicht-tumoröses Gebiet aussieht. Diese Informationen sind wichtig, weil sie es uns ermöglichen, ein effektiveres Modell zur Klassifizierung von Zellpatches im WSI zu erstellen.
Struktur der vorgeschlagenen Methode
Die Methode, die wir vorschlagen, zerlegt das Problem in zwei kleinere Aufgaben. Die erste Aufgabe nennt sich Multiple-Instance-Learning (MIL), bei der es darum geht festzustellen, ob ein Probenpatch Tumor- oder Nicht-Tumorgewebe ist. Die zweite Aufgabe heisst Lernen aus Labelproportionen (LLP), die die verfügbaren Tumorsubtypenanteile nutzt, um die Klassifikation weiter zu verfeinern.
Multiple Instance Learning (MIL)
In der MIL-Aufgabe finden wir heraus, ob jeder einzelne Patch innerhalb des WSI positiv (enthält Tumorzellen) oder negativ (enthält nicht-Tumorzellen) ist. Mithilfe eines neuronalen Netzwerks können wir Vorhersagen basierend auf den Eigenschaften der Patches treffen. Das bedeutet, dass wir für jeden Patch sicher sagen können, ob er zu einem der Tumorsubtypen gehört oder ein gesunder Patch ist.
Lernen aus Labelproportionen (LLP)
Sobald wir die Patches klassifiziert haben, gehen wir zur LLP-Aufgabe über. Dieser Schritt beinhaltet, die Informationen aus der MIL-Aufgabe zu nutzen, um die Patches präziser zu klassifizieren. Wir verwenden die Anteile der Tumorsubtypen, um unser Verständnis darüber, wie die gesunden und Tumorpatches zueinander stehen, zu verbessern.
Alles zusammenbringen
Die Schönheit unseres Ansatzes liegt in seiner gemeinsamen Lernfähigkeit. Anstatt MIL und LLP als separate Aufgaben zu behandeln, optimieren wir beide gleichzeitig. Das bedeutet, dass das Ergebnis der ersten Aufgabe die Genauigkeit der zweiten Aufgabe verbessert. Solch eine Integration ermöglicht einen kohärenteren und zuverlässigeren Klassifikationsprozess.
Verwandte Arbeiten
In der Vergangenheit haben mehrere Methoden versucht, ähnliche Aufgaben zu erledigen, aber die meisten konzentrierten sich entweder auf binäre Klassifikation (Tumor vs. Nicht-Tumor) oder benötigten vollständige Labelinformationen für alle Klassen. Unsere Methode ist einzigartig, weil sie die Verwendung von partiellen Labels ermöglicht, die in der realen Welt oft verfügbar sind.
Implementierung und experimentelle Ergebnisse
Um die Effektivität unseres Ansatzes zu bewerten, haben wir ihn an zwei Datensätzen getestet. Der erste Datensatz, CRC100K, enthält Bilder mit neun Klassen von Gewebeannotationen, die mit kolorektalem Krebs zusammenhängen. In unseren Experimenten konzentrierten wir uns nur auf zwei Tumorklassen und gruppierten die restlichen Klassen als nicht-Tumor.
Der zweite Datensatz beinhaltete Chemotherapieproben, die gesunde, Tumorbett- und Residualtumorklassifikationen enthielten. In der klinischen Praxis wird die Lebensfähigkeit von Tumoren basierend auf den Anteilen der positiven Klassen bestimmt, während die Anteile der nicht-tumorösen Regionen unbekannt bleiben.
Evaluierung der Genauigkeit
Unsere Ergebnisse waren vielversprechend. Wir massen die Genauigkeit unserer Methode im Vergleich zu traditionellen überwachten Lerntechniken und anderen bestehenden Methoden. Trotz der Herausforderungen durch partielle Labels schnitt unsere Methode vergleichbar gut ab wie Modelle, die vollständigere Daten verwendeten.
Vergleichende Ergebnisse
In beiden Datensätzen übertraf unser Ansatz Basis-Methoden, die die beiden Aufgaben nicht zusammen optimierten. Zum Beispiel fanden wir heraus, dass Methoden, die traditionelle Ansätze erweiterten, in der genauen Klassifikation negativer Instanzen hinterherhinkten. Durch die gleichzeitige Optimierung von MIL und LLP zeigte unsere Methode verbesserte Leistungen.
Segmentierungsergebnisse
Wir haben die Segmentierungsergebnisse auch qualitativ analysiert. Als wir die Ausgaben unserer Methode im Vergleich zu traditionellen Methoden visualisierten, war unsere Segmentierung klarer und genauer. Das beweist, dass unser Ansatz Tumorsubtypen auch mit begrenzten Daten effektiv identifizieren kann.
Fazit
Zusammenfassend zeigt diese neue Methode zur Klassifizierung von WSIs, dass es möglich ist, effektiv mit partiellen Labelinformationen zu arbeiten. Indem wir das Problem in manageable Aufgaben zerlegen und sie gemeinsam optimieren, können wir Ergebnisse erzielen, die wettbewerbsfähig mit denen sind, die vollständigere Beschriftungen verwenden. Das könnte letztendlich zu besserer Unterstützung für Pathologen führen, um wichtige Entscheidungen über Krebsdiagnosen und -behandlungen zu treffen.
Die Ergebnisse deuten darauf hin, dass die Verwendung partieller Labelproportionen helfen kann, effektive Klassifikationsmodelle zu erstellen, ohne umfangreiche vorherige Beschriftungen, was letztendlich Gesundheitsversorgungsszenarien zugutekommen könnte, in denen Ressourcen begrenzt sind.
Titel: Learning from Partial Label Proportions for Whole Slide Image Segmentation
Zusammenfassung: In this paper, we address the segmentation of tumor subtypes in whole slide images (WSI) by utilizing incomplete label proportions. Specifically, we utilize `partial' label proportions, which give the proportions among tumor subtypes but do not give the proportion between tumor and non-tumor. Partial label proportions are recorded as the standard diagnostic information by pathologists, and we, therefore, want to use them for realizing the segmentation model that can classify each WSI patch into one of the tumor subtypes or non-tumor. We call this problem ``learning from partial label proportions (LPLP)'' and formulate the problem as a weakly supervised learning problem. Then, we propose an efficient algorithm for this challenging problem by decomposing it into two weakly supervised learning subproblems: multiple instance learning (MIL) and learning from label proportions (LLP). These subproblems are optimized efficiently in the end-to-end manner. The effectiveness of our algorithm is demonstrated through experiments conducted on two WSI datasets.
Autoren: Shinnosuke Matsuo, Daiki Suehiro, Seiichi Uchida, Hiroaki Ito, Kazuhiro Terada, Akihiko Yoshizawa, Ryoma Bise
Letzte Aktualisierung: 2024-05-14 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2405.09041
Quell-PDF: https://arxiv.org/pdf/2405.09041
Lizenz: https://creativecommons.org/licenses/by-nc-sa/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.