Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Elektrotechnik und Systemtechnik# Bild- und Videoverarbeitung# Maschinelles Lernen

Verbesserung der Augenbildsegmentierung durch Rauschreduzierungstechniken

Diese Arbeit verbessert die Segmentierung von Netzhautfundusbildern durch Rauschreduktionsmethoden.

― 6 min Lesedauer


Fortschritte bei derFortschritte bei derAugenbildsegmentierungstechnikenNetzhautbildgebung.Rauschunterdrückung in derVerbesserte Segmentierung durch
Inhaltsverzeichnis

Domänenverallgemeinerung ist eine Methode, die hilft, dass Machine-Learning-Modelle gut mit neuen Daten umgehen können, die sie während des Trainings nicht gesehen haben. In dieser Arbeit konzentrieren wir uns darauf, wie gut diese Modelle Bilder vom Auge segmentieren können, insbesondere die Netzhautbilder, die wichtig sind, um Augenerkrankungen zu erkennen.

Wenn wir Modelle mit verschiedenen Datentypen trainieren, haben sie oft Schwierigkeiten, das Gelernte auf neue, anders aussehende Daten anzuwenden. Wir benutzen eine Technik mit der Fourier-Transformation, um die Frequenzkomponenten von Bildern zu analysieren und zu manipulieren. Diese Technik kann helfen, die Leistung des Modells zu verbessern, wenn es mit neuen, nicht gesehenen Bildern konfrontiert wird.

Hintergrund

Im Bereich der Bildverarbeitung zerlegt die Fourier-Transformation Bilder in Komponenten basierend auf unterschiedlichen Frequenzen. Die Niedrigfrequenzkomponenten repräsentieren typischerweise die grundlegende Struktur oder den Stil eines Bildes, während die Hochfrequenzkomponenten die Details und den Inhalt darstellen. Indem wir die Niedrigfrequenzkomponenten zwischen Bildern aus verschiedenen Domänen austauschen, können wir unseren Modellen helfen, besser auf neue Bilder zu verallgemeinern.

Allerdings übersehen bestehende Methoden, die sich auf die Fourier-Transformation stützen, oft die Auswirkungen des Hintergrunds in Bildern. Hintergrundrauschen kann die Lern- und Leistungsfähigkeit des Modells stören. Um dieses Problem anzugehen, schlagen wir eine Methode vor, die weiche Schwellenwerte verwendet, um unerwünschtes Hintergrundrauschen aus den Bildern zu filtern.

Segmentierung von Netzhautbildern

Netzhautbilder sind entscheidend für die Diagnose und Behandlung von Augenerkrankungen wie diabetischer Retinopathie und Glaukom. Eine genaue Segmentierung (der Prozess, spezifische Regionen in einem Bild zu identifizieren und zu isolieren) wichtiger Merkmale in diesen Bildern, wie der optischen Tasse und der optischen Scheibe, ist wesentlich.

Modelle, die für die Segmentierung dieser Bilder trainiert wurden, haben oft Schwierigkeiten, wenn sie auf Bilder aus verschiedenen Kliniken oder mit unterschiedlicher Ausrüstung angewendet werden. Die Unterschiede in der Bildqualität und Beleuchtung können die Funktionsweise der Modelle beeinflussen. Hier wird die Domänenverallgemeinerung entscheidend. Wir wollen Modelle entwickeln, die sich an diese neuen und vielfältigen Bilder anpassen können.

Die Herausforderung

Medizinische Bilder stammen oft aus verschiedenen Quellen, was zu Verschiebungen in der Verteilung der Daten führt. Wenn ein Modell mit Daten aus einer Quelle trainiert wird, schneidet es möglicherweise bei Bildern aus einer anderen Quelle nicht gut ab. Unser Ziel ist es, ein Modell mit einem Satz von Bildern zu trainieren und es effektiv auf einem völlig anderen, zuvor nicht gesehenen Satz arbeiten zu lassen.

Um dies zu erreichen, verwenden wir Techniken der Domänenverallgemeinerung, um eine Reihe von Datenverteilungen aus unseren Trainingsbildern zu erstellen.

Fourier-Transformationsbasierte Domänenverallgemeinerung

Eine Methode, die als Fourier-transformationsbasierte Domänenverallgemeinerung bekannt ist, wurde entwickelt, um die Herausforderungen zu bewältigen, mit denen wir konfrontiert sind. Dabei werden die Niedrigfrequenzkomponenten verschiedener Bilder gemischt, während die Hochfrequenzkomponenten unverändert bleiben.

Dieser Ansatz versucht, die Stärken der Fourier-Transformation zu nutzen, indem er die grundlegenden Stile (Niedrigfrequenzinformationen) eines Bildes nimmt und diese Stile auf ein anderes anwendet. Allerdings trägt es wenig dazu bei, die Hintergrundeffekte zu mindern, die das Modell verwirren könnten. Dies kann zu Problemen wie unerwünschten Schatten oder Artefakten in den verarbeiteten Bildern führen.

Einführung von Soft Thresholding

Soft Thresholding ist eine Technik, die häufig in der Signalverarbeitung verwendet wird, um Rauschen zu reduzieren und die Datenqualität zu verbessern. Diese Technik minimiert den Einfluss kleiner Werte, die möglicherweise Rauschen in den Daten darstellen, während die signifikanten Teile intakt bleiben.

In unserer Arbeit wenden wir Soft Thresholding im Fourier-Bereich an, um unerwünschtes Hintergrundrauschen besser herauszufiltern. Anstatt einfach die Frequenzkomponenten zwischen Bildern auszutauschen, verbessern wir den Prozess, indem wir einen Filter implementieren, der gezielt die Auswirkungen des Hintergrunds in den Zielbildern reduziert.

Durch die Anwendung dieses Soft-Thresholding-Filters auf das Amplitudespektrum der Fourier-transformierten Bilder können wir die Qualität der augmentierten Bilder verbessern. Das Ergebnis sind sauberere Bilder mit weniger Hintergrundinterferenz, was es den Modellen erleichtert, effektiv zu lernen und zu verallgemeinern.

Implementierung

Um unsere Methode zu testen, konzentrieren wir uns auf die Segmentierung der optischen Tasse und der optischen Scheibe in Netzhautbildern. Wir verwenden mehrere öffentlich verfügbare Datensätze aus verschiedenen Kliniken, die jeweils ihre eigenen Eigenschaften haben. Indem wir unser Modell mit diesen Datensätzen trainieren, wollen wir seine Leistung bei nicht gesehenen Bildern verbessern.

Zu diesem Zweck verwenden wir verschiedene Vergleichsmethoden, um zu bewerten, wie gut unser Modell im Vergleich zu anderen in diesem Bereich abschneidet. Die Bewertungsmetriken, die wir verwenden, beinhalten, wie gut das Modell die optische Tasse und Scheibe segmentieren kann, und wir suchen nach Verbesserungen in der Genauigkeit und Reduzierung von Fehlern.

Experimentelles Setup

In unseren Experimenten nehmen wir Netzhautbilder und erstellen Regionen von Interesse, in denen sich die optische Tasse und die optische Scheibe befinden. Unser Ansatz umfasst die Ausbildung eines Modells mit einem standardisierten Segmentierungsrahmen, der es uns ermöglicht, die Ergebnisse unserer vorgeschlagenen Methode mit anderen modernen Techniken zu vergleichen.

Wir implementieren eine Teststrategie namens leave-one-domain-out, bei der das Modell mit drei Datensätzen trainiert und auf dem vierten getestet wird, der zuvor nicht gesehen wurde. Diese Methode ermöglicht eine gründliche Bewertung der Verallgemeinerungsfähigkeit des Modells.

Wir sorgen auch für einen fairen Vergleich, indem wir dieselbe neuronale Netzwerkarchitektur und Trainingsumgebung für verschiedene Methoden verwenden. Das bedeutet, dass jedes Modell eine konsistente Trainingserfahrung erhält, was es uns ermöglicht, die Unterschiede in der Leistung klar zu erkennen.

Ergebnisse

Unsere Ergebnisse zeigen, dass die Einführung von Soft Thresholding die Leistung des Modells erheblich verbessert. Durch die effektive Reduzierung von Hintergrundinterferenzen erhalten wir klarere Segmentierungen der optischen Tasse und Scheibe. Wie erwartet zeigt die quantitative Analyse, dass unser Modell niedrigere durchschnittliche Hausdorff-Abstände und Flächenabstände sowie höhere Ähnlichkeitskoeffizienten im Vergleich zu anderen Methoden erreicht.

Die Beispiele der Segmentierungsergebnisse verdeutlichen die Verbesserungen, die durch unsere vorgeschlagene Methode möglich wurden. Anders als traditionelle Techniken, die möglicherweise Artefakte und Schatten hinterlassen, führt unser verbesserter Ansatz zu saubereren Ergebnissen, die der Wahrheit näherkommen.

Fazit

Zusammenfassend zeigt unsere Arbeit die Vorteile der Einbeziehung von Soft Thresholding innerhalb des Rahmens der Fourier-transformationsbasierten Domänenverallgemeinerung für die Segmentierung von Netzhautbildern. Indem wir das Problem der Hintergrundinterferenz angehen, ermöglichen wir unserem Modell, besser mit nicht gesehenen Daten aus verschiedenen Quellen umzugehen.

Die Ergebnisse zeigen, dass unser kombinierter Ansatz nicht nur überlegene Segmentierungsergebnisse erzielt, sondern auch zur besseren Gesamtleistung des Modells beiträgt. Diese Arbeit eröffnet neue Möglichkeiten zur Verbesserung von Techniken der Domänenverallgemeinerung im Bereich der medizinischen Bildanalyse und fördert effektivere Werkzeuge für die frühe Diagnose und Krankheitsbewältigung.

Originalquelle

Titel: Domain Generalization with Fourier Transform and Soft Thresholding

Zusammenfassung: Domain generalization aims to train models on multiple source domains so that they can generalize well to unseen target domains. Among many domain generalization methods, Fourier-transform-based domain generalization methods have gained popularity primarily because they exploit the power of Fourier transformation to capture essential patterns and regularities in the data, making the model more robust to domain shifts. The mainstream Fourier-transform-based domain generalization swaps the Fourier amplitude spectrum while preserving the phase spectrum between the source and the target images. However, it neglects background interference in the amplitude spectrum. To overcome this limitation, we introduce a soft-thresholding function in the Fourier domain. We apply this newly designed algorithm to retinal fundus image segmentation, which is important for diagnosing ocular diseases but the neural network's performance can degrade across different sources due to domain shifts. The proposed technique basically enhances fundus image augmentation by eliminating small values in the Fourier domain and providing better generalization. The innovative nature of the soft thresholding fused with Fourier-transform-based domain generalization improves neural network models' performance by reducing the target images' background interference significantly. Experiments on public data validate our approach's effectiveness over conventional and state-of-the-art methods with superior segmentation metrics.

Autoren: Hongyi Pan, Bin Wang, Zheyuan Zhang, Xin Zhu, Debesh Jha, Ahmet Enis Cetin, Concetto Spampinato, Ulas Bagci

Letzte Aktualisierung: 2023-12-12 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2309.09866

Quell-PDF: https://arxiv.org/pdf/2309.09866

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel