Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Quantitative Biologie# Computer Vision und Mustererkennung# Quantitative Methoden

MUSTANG: WSI-Analyse in der Medizin voranbringen

Eine neuartige Methode zur Analyse von Ganzbildaufnahmen für eine bessere Krankheitsklassifikation.

― 6 min Lesedauer


MUSTANG verwandelt dieMUSTANG verwandelt dieWSI-AnalyseDiagnose von medizinischen Bildern.KI-gesteuerte Methode verbessert die
Inhaltsverzeichnis

Whole Slide Images (WSIs) sind grosse digitale Bilder, die in medizinischen Einrichtungen verwendet werden, vor allem beim Untersuchen von Gewebeproben. Sie bieten detaillierte Ansichten, die für die Diagnose von Krankheiten, besonders Krebs, nötig sind. Allerdings bringen diese Bilder auch ihre eigenen Herausforderungen mit sich. Sie können unglaublich gross sein und haben oft Milliarden von Pixeln, was die Analyse schwierig macht. Ausserdem können sie Mängel oder Artefakte aufweisen, die den Interpretationsprozess komplizieren.

Trotz dieser Hindernisse sind WSIs essenziell, da sie als der Goldstandard bei der Diagnose von Erkrankungen und der Entscheidung über Behandlungsoptionen gelten. Sie enthalten wertvolle Informationen über die Gesundheit des Patienten, aber die meisten klinischen Datensätze, die mit ihnen verknüpft sind, haben oft keine detaillierten Anmerkungen. Das erschwert es Computerprogrammen, die Informationen in diesen Bildern effektiv zu interpretieren.

Das Problem mit WSIs

Die Analyse von WSIs erfordert spezielle Fähigkeiten, die normalerweise von qualifizierten medizinischen Fachkräften gehalten werden. Der manuelle Prozess, diese Slides zu untersuchen, kann zeitaufwendig und fehleranfällig sein. Der Aufstieg von automatisierter Analyse durch Künstliche Intelligenz (KI) und maschinelles Lernen bietet eine mögliche Lösung. Ein grosses Problem ist jedoch, dass viele bestehende KI-Methoden mit der schieren Grösse und Komplexität von WSIs kämpfen.

Um diese Probleme anzugehen, arbeiten Forscher an Techniken, die es Computern ermöglichen, aus diesen Bildern zu lernen, ohne dass für jedes Teil detaillierte Labels erforderlich sind. Diese Art des Lernens wird als schwach überwacht bezeichnet. Selbst mit schwacher Überwachung haben viele Modelle Schwierigkeiten, wichtige Merkmale zu erkennen, wenn sie weit voneinander entfernt im Bild sind.

Vorgeschlagene Lösung

Ein neuer Ansatz kombiniert Selbstaufmerksamkeitsmechanismen mit Graphdarstellungen, um WSIs besser zu analysieren. Diese Methode, genannt MUSTANG, zielt darauf ab, Bilder basierend auf patientenspezifischen Informationen zu klassifizieren, ohne dass Anmerkungen für jede Folie benötigt werden.

MUSTANG funktioniert, indem es das gesamte Bild in kleinere Fragmente aufteilt. Diese Fragmente, die kleine Bereiche des Gewebes darstellen könnten, werden dann als Vektoren eingebettet, die ihre Merkmale beschreiben. Als nächstes werden Verbindungen zwischen diesen Fragmenten basierend auf ihren Ähnlichkeiten mit einer speziellen Methode, dem -Nearest Neighbour Graph, hergestellt. Dieser Graph ist spärlich, was bedeutet, dass er nur die relevantesten Verbindungen enthält, wodurch die Berechnungen effizienter werden.

Durch den Einsatz von Selbstaufmerksamkeit kann das Modell sich auf die wichtigsten Fragmente konzentrieren, selbst wenn sie weit auseinander im Bild liegen. Das hilft, sowohl kleine als auch grosse Muster zu erfassen, die für eine genaue Klassifikation notwendig sind. Das Design von MUSTANG ermöglicht es auch, mit verschiedenen Datensätzen zu arbeiten, ohne umfangreiche Vorverarbeitung zu benötigen.

Anwendung auf Rheumatoide Arthritis

Eine der praktischen Anwendungen der MUSTANG-Pipeline ist die Analyse von Gewebeproben von Patienten mit rheumatoider Arthritis. In einer klinischen Studie verwendeten Forscher WSIs von verschiedenen Patienten, um Gewebeproben aus Gelenken zu bewerten. Die Patienten wurden dann basierend auf ihrem Krankheitsuntertyp in verschiedene Gruppen eingeteilt.

Jede Gewebeprobe wurde mit speziellen Färbemitteln gefärbt, um verschiedene Zelltypen und Strukturen sichtbar zu machen. Zum Beispiel zeigt die Hämatoxylin-Eosin (H&E)-Färbung eine allgemeine Ansicht der Gewebestruktur, während die Immunhistochemie (IHC)-Färbung es ermöglicht, spezifische Immunzellen zu identifizieren. Dieser Multi-Färbungsansatz gibt einen umfassenden Überblick über die zugrunde liegenden Krankheitsprozesse.

Pathologen bewerteten diese gefärbten Proben und gruppierten die Patienten basierend auf ihren Merkmalen. Da jeder Patient jedoch mehrere Folien haben könnte, fügte dies der Analyse eine weitere Komplexität hinzu. MUSTANG stellte sich dieser Herausforderung, indem es ein Modell schuf, das in der Lage ist, aus den kollektiven Informationen dieser WSIs zu lernen, anstatt sich auf einzelne Folien zu verlassen.

Schritte in der MUSTANG-Pipeline

Die MUSTANG-Pipeline besteht aus mehreren Schritten:

  1. Segmentierung: Der erste Schritt besteht darin, die relevanten Gewebeareale innerhalb der WSIs zu identifizieren. Dies geschah mit einem Deep-Learning-Modell namens UNet, das das Gewebe von Hintergrundelementen segmentiert.

  2. Patching: Sobald das Gewebe identifiziert ist, wird der relevante Bereich in kleinere Fragmente unterteilt. Die Grösse dieser Fragmente kann je nach Benutzerpräferenz variieren und bietet Flexibilität bei der Analyse.

  3. Merkmalextraktion: Jedes Fragment wird dann durch einen Merkmals-Extraktor verarbeitet, der auf einem Deep-Learning-Modell basiert, das die Bilder in numerische Vektoren umwandelt, die ihre wichtigen Eigenschaften zusammenfassen.

  4. Erstellen des Graphen: Die Merkmalsvektoren werden verwendet, um den -Nearest Neighbour Graph zu erstellen, wobei jedes Fragment mit seinen nächsten Fragmenten basierend auf ihren Merkmalen verbunden ist. Diese Graphstruktur ist entscheidend für die Ermöglichung effizienter Analysen.

  5. Graph Klassifikation: Die Graphdarstellung wird durch Schichten eines speziellen neuronalen Netzwerks verarbeitet, das für Graphen ausgelegt ist, bekannt als Graph Attention Networks. Dies ermöglicht es dem Modell, die Bedeutung verschiedener Fragmente zu gewichten, bevor eine endgültige Klassifikation vorgenommen wird.

  6. Vorhersage: Schliesslich sagt das Modell den Krankheitsuntertyp für den Patienten basierend auf den kollektiven Informationen seiner Folien voraus.

Ergebnisse und Leistung

Die Ergebnisse des MUSTANG-Ansatzes zeigen, dass er bestehende Modelle in Bezug auf die Genauigkeit übertrifft, wenn er auf den Datensatz der rheumatoiden Arthritis angewendet wird. Es erwies sich als effektiv darin, relevante Muster und Beziehungen innerhalb der Multi-Färbungsbilder zu identifizieren. Das Modell erzielte in Bezug auf die Verarbeitungszeit ähnliche Ergebnisse, trotz seiner komplexeren Operationen.

Bei der Bewertung, wie gut das Modell funktionierte, stellten die Forscher fest, dass es besonders gut darin war, sowohl wahre als auch falsche Positivmeldungen zu erkennen. Diese Sensitivität ist entscheidend, wenn sie in klinischen Umgebungen angewendet wird, wo eine genaue Diagnose erhebliche Auswirkungen auf die Patientenergebnisse haben kann.

Darüber hinaus lieferte MUSTANG beim Testen gegen einfarbige WSIs immer noch beeindruckende Ergebnisse und zeigte, dass es erfolgreich Informationen aus verschiedenen Färbungen integrieren konnte. Das ist besonders wertvoll, da klinische Datensätze oft keine klaren Hinweise darauf enthalten, welche Färbungen die wichtigsten Informationen liefern.

Einschränkungen

Obwohl die MUSTANG-Pipeline eine vielversprechende Methode zur Analyse von WSIs einführt, hat sie einige Einschränkungen. Es besteht Bedarf an öffentlichen Datensätzen, die zum Vergleich und zur Validierung der Ergebnisse verwendet werden können. Leider fehlen derzeit Datensätze mit multi-färbigen WSIs, die auf Patientenebene beschriftet sind.

Ein weiterer wichtiger Aspekt ist das Fehlen von Visualisierungstools, um die Fokusbereiche des Modells zu veranschaulichen. Eine Visualisierung würde die Glaubwürdigkeit und Nutzbarkeit des Modells in einer realen klinischen Umgebung erheblich verbessern und Pathologen helfen, zu verstehen, wie das Modell zu seinen Schlussfolgerungen kam.

Fazit

MUSTANG ist ein innovativer Ansatz zur Analyse komplexer medizinischer Bilder, insbesondere im Bereich der Histopathologie. Durch die effektive Kombination von Selbstaufmerksamkeitsmechanismen mit graphbasierten Darstellungen bietet es eine robuste Lösung zur Klassifizierung von WSIs, ohne dass umfangreiche Anmerkungen erforderlich sind. Wenn mehr klinische Datensätze verfügbar werden, hat diese Technologie das Potenzial, die diagnostische Genauigkeit zu verbessern und den Workflow in der Histopathologie zu optimieren, was letztendlich zu einer besseren Patientenversorgung führt.

Die Modularität und Flexibilität von MUSTANG machen es für eine Vielzahl von klinischen Anwendungen geeignet und ebnen den Weg für eine umfassende Nutzung im medizinischen Bereich. Diese Forschung zeigt die Bedeutung von KI und maschinellem Lernen bei der Transformation, wie medizinische Fachkräfte wichtige Gesundheitsinformationen analysieren und interpretieren.

Originalquelle

Titel: MUSTANG: Multi-Stain Self-Attention Graph Multiple Instance Learning Pipeline for Histopathology Whole Slide Images

Zusammenfassung: Whole Slide Images (WSIs) present a challenging computer vision task due to their gigapixel size and presence of numerous artefacts. Yet they are a valuable resource for patient diagnosis and stratification, often representing the gold standard for diagnostic tasks. Real-world clinical datasets tend to come as sets of heterogeneous WSIs with labels present at the patient-level, with poor to no annotations. Weakly supervised attention-based multiple instance learning approaches have been developed in recent years to address these challenges, but can fail to resolve both long and short-range dependencies. Here we propose an end-to-end multi-stain self-attention graph (MUSTANG) multiple instance learning pipeline, which is designed to solve a weakly-supervised gigapixel multi-image classification task, where the label is assigned at the patient-level, but no slide-level labels or region annotations are available. The pipeline uses a self-attention based approach by restricting the operations to a highly sparse k-Nearest Neighbour Graph of embedded WSI patches based on the Euclidean distance. We show this approach achieves a state-of-the-art F1-score/AUC of 0.89/0.92, outperforming the widely used CLAM model. Our approach is highly modular and can easily be modified to suit different clinical datasets, as it only requires a patient-level label without annotations and accepts WSI sets of different sizes, as the graphs can be of varying sizes and structures. The source code can be found at https://github.com/AmayaGS/MUSTANG.

Autoren: Amaya Gallagher-Syed, Luca Rossi, Felice Rivellese, Costantino Pitzalis, Myles Lewis, Michael Barnes, Gregory Slabaugh

Letzte Aktualisierung: 2023-10-04 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2309.10650

Quell-PDF: https://arxiv.org/pdf/2309.10650

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel