Fortschritte in der fotoakustischen Tomographie mit Deep Learning
Ein neuer Ansatz verbessert die Bildqualität in der photoakustischen Tomographie mit Deep Learning.
― 6 min Lesedauer
Inhaltsverzeichnis
Fotoakustische Tomographie (PAT) ist 'ne medizinische Bildgebungstechnik, die Licht und Schallwellen kombiniert, um Bilder vom Inneren des Körpers zu erstellen. Das Ganze beginnt damit, dass ein kurzer Laserlichtblitz auf einen Körperteil gestrahlt wird. Ein Teil des Lichts wird absorbiert, was dazu führt, dass der Bereich sich erhitzt und dann wieder abkühlt. Diese Temperaturänderung erzeugt Schallwellen, die durch den Körper reisen. Spezielle Geräte, die Transducer heissen, nehmen diese Schallwellen von der Oberfläche des Körpers auf. Die gesammelten Informationen helfen dabei, ein Bild vom ursprünglichen Schallwellendruck im Körper zu rekonstruieren.
Bei dieser Bildgebungstechnik liegt die Herausforderung darin, wie man die Bilder genau aus den akustischen Signalen, die an der Oberfläche gesammelt wurden, zurückgewinnt. Eine gängige Methode, dieses Problem zu lösen, ist die zirkuläre Radon-Transformation. Allerdings kann diese Methode manchmal Bilder erzeugen, die voller Artefakte sind – unerwünschte Verzerrungen, die die Bilder schwer nutzbar machen.
Probleme mit Traditionellen Algorithmen
Der traditionelle Ansatz, um das invers Problem von PAT zu lösen, insbesondere wenn man mit unvollständigen Daten arbeitet, ist eine Methode namens truncierte singular value decomposition (TSVD). Diese Technik hat sich zwar als nützlich erwiesen, führt jedoch oft zu Bildern, die bedeutende Artefakte enthalten. Diese Artefakte können die rekonstruierten Bilder unbrauchbar machen, vor allem wenn die gesammelten Daten begrenzt oder verrauscht sind.
In vielen realen Anwendungen kann es teuer oder unpraktisch sein, vollständige Daten zu erhalten, da das notwendige Equipment viel kostet und es Bereiche gibt, die nicht erreichbar sind. Diese Einschränkung führt zu einem, was als partielle radiale Anordnung bekannt ist, bei der nur einige der Datenpunkte gesammelt werden. Das Ziel ist es, die ursprüngliche Druckverteilung aus den begrenzten Messungen zurückzugewinnen, was ein komplexes rechnerisches Problem darstellt.
Deep Learning Lösung
Jüngste Fortschritte im Deep Learning haben vielversprechende Ergebnisse bei der Lösung von Problemen in der medizinischen Bildgebung, einschliesslich PAT, gezeigt. Deep Learning nutzt Algorithmen, die aus Daten lernen und Vorhersagen oder Entscheidungen treffen können, ohne für jede Aufgabe explizit programmiert zu werden. In diesem Zusammenhang schlagen wir einen neuen Ansatz vor, der ein bestimmtes Deep-Learning-Modell namens U-Net verwendet.
Das U-Net ist darauf ausgelegt, Rohmessdaten zu nehmen und zu lernen, wie man die zugrunde liegenden Bilder rekonstruiert. Indem wir das U-Net mit Beispielen bekannter Ergebnisse trainieren, wird es in der Lage, genaue Vorhersagen zu treffen, wenn es mit neuen, unbekannten Daten konfrontiert wird. In unserem Fall wird das U-Net lernen, das ursprüngliche Druckfeld aus Messungen zu rekonstruieren, die unvollständig oder verrauscht sein könnten.
Datensatz und Trainingsprozess
Um das U-Net zu trainieren, generieren wir einen synthetischen Datensatz mithilfe eines Modells namens Shepp-Logan Phantom. Dieses Phantom stellt verschiedene Gewebe im Körper als eine Mischung aus Formen und Intensitäten dar. Wir führen Variationen im Datensatz ein, indem wir diese Formen rotieren und verschieben und Rauschen hinzufügen, um reale Bedingungen zu simulieren.
Das Training besteht darin, dem U-Net viele Beispiele zu präsentieren, damit es lernen kann, die Eingabemessungen mit den richtigen Ausgabebildern zu verbinden. Das U-Net durchläuft einen Prozess, bei dem es allmählich lernt, Fehler in seinen Vorhersagen über viele Iterationen zu minimieren und sein Verständnis dafür zu verfeinern, wie die Messungen mit dem Bild zusammenhängen.
U-Net Architektur
Die Architektur des U-Net besteht aus einem kontrahierenden Pfad und einem expandierenden Pfad. Der kontrahierende Pfad reduziert die räumliche Grösse des Eingangs, während er wesentliche Merkmale der Bilder erfasst. Der expandierende Pfad zielt dann darauf ab, die Grösse wieder auf das Original zu erhöhen und das Bild effektiv zu rekonstruieren. Diese Architektur ermöglicht es dem U-Net, verschiedene Detailstufen zu lernen, was es effektiv für Bildrekonstruktionsaufgaben macht.
Skip-Verbindungen im U-Net helfen, Informationen in verschiedenen Verarbeitungsstufen zu kombinieren, sodass das Modell wertvolle Merkmale aus früheren Phasen des Netzwerks beibehalten kann, während das Bild in späteren Phasen rekonstruiert wird.
Bewertung der Leistung
Um zu bewerten, wie gut das U-Net abschneidet, verwenden wir zwei wichtige Kennzahlen: das Peak-Signal-to-Noise-Verhältnis (PSNR) und den strukturellen Ähnlichkeitsindex (SSIM). Diese Kennzahlen helfen dabei, die Qualität der rekonstruierten Bilder im Vergleich zum Original zu quantifizieren. Ein höherer PSNR deutet auf ein klareres Bild hin, während ein SSIM-Wert, der näher bei eins liegt, auf eine stärkere strukturelle Ähnlichkeit mit dem Originalbild hindeutet.
Ergebnisse für die Vollansicht
Wir beginnen mit dem Test unseres trainierten U-Net in einer Vollansicht, wo vollständige Daten in allen Winkeln verfügbar sind. Das U-Net rekonstruiert erfolgreich Bilder ohne Artefakte, im Gegensatz zur TSVD-Methode, die oft keine klaren Bilder liefert, da unerwünschte Verzerrungen vorhanden sind.
Wenn wir jedoch Rauschen in die Messungen einführen, kann die Leistung des U-Net variieren. Wenn es mit sauberen Daten trainiert wird, hat das U-Net Schwierigkeiten mit verrauschten Proben. Um dies anzugehen, erstellen wir ein neues U-Net-Modell, das speziell mit einer Mischung aus sauberen und verrauschten Daten trainiert wird, was seine Robustheit und Fähigkeit, auf verschiedene Datentypen zu generalisieren, erheblich verbessert.
Ergebnisse für die begrenzte Ansicht
Als Nächstes untersuchen wir die Situation mit begrenzter Sicht, wo nur Teil-Daten verfügbar sind. Das trainierte U-Net muss nun mit reduzierten Informationen aus den Messungen zurechtkommen. Trotz dieser Herausforderung schneidet das U-Net, das mit gemischten Daten trainiert wurde, weiterhin gut ab und produziert Bilder, die genau und frei von Artefakten sind. Im Gegensatz dazu hat die TSVD-Methode erhebliche Probleme, die zu Bildern führen, die stark von Artefakten kontaminiert sind.
Die Robustheit des U-Net wird weiter bestätigt, indem seine Leistung gegen Rauschen über verschiedene Datensätze bewertet wird. Die Leistungskennzahlen zeigen konstant hochwertigere Rekonstruktionen im Vergleich zu den Ergebnissen, die durch TSVD erzielt wurden.
Zukünftige Richtungen
Der Erfolg des U-Net in der partiellen radialen Anordnung eröffnet neue Möglichkeiten für zukünftige Forschungen, insbesondere in der Anpassung dieses Modells an andere Konfigurationen der PAT-Bildgebung. Dazu gehören Szenarien mit unterschiedlichen Schallgeschwindigkeiten und verschiedenen Arten von akustischen Messungen, wie etwa der Nachweis von Energieflüssen.
Darüber hinaus ist es ein wesentlicher Schritt, Rahmenbedingungen zu schaffen, die die Unsicherheit in den Vorhersagen des Modells bewerten, wobei Techniken basierend auf Bayesscher Inferenz verwendet werden. Dies würde wertvolle Einblicke bieten, insbesondere in kritischen medizinischen Entscheidungen, bei denen Genauigkeit entscheidend ist.
Fazit
Zusammenfassend haben wir eine Deep-Learning-basierte Methode zur Lösung der Herausforderungen vorgestellt, die durch zirkuläre Radon-Transformationen in der partiellen radialen Anordnung der fotoakustischen Tomographie entstehen. Durch die Nutzung eines U-Net können wir effektiv Bilder aus den ursprünglichen Messungen zurückgewinnen und die Einschränkungen traditioneller Algorithmen wie TSVD überwinden. Unsere numerischen Experimente zeigen signifikante Verbesserungen in der Bildqualität, und wir glauben, dass dieser Ansatz eine wichtige Rolle bei der Verbesserung der medizinischen Bildgebungstechniken in der Zukunft spielen kann.
Titel: Learning end-to-end inversion of circular Radon transforms in the partial radial setup
Zusammenfassung: We present a deep learning-based computational algorithm for inversion of circular Radon transforms in the partial radial setup, arising in photoacoustic tomography. We first demonstrate that the truncated singular value decomposition-based method, which is the only traditional algorithm available to solve this problem, leads to severe artifacts which renders the reconstructed field as unusable. With the objective of overcoming this computational bottleneck, we train a ResBlock based U-Net to recover the inferred field that directly operates on the measured data. Numerical results with augmented Shepp-Logan phantoms, in the presence of noisy full and limited view data, demonstrate the superiority of the proposed algorithm.
Autoren: Deep Ray, Souvik Roy
Letzte Aktualisierung: 2023-08-27 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2308.14144
Quell-PDF: https://arxiv.org/pdf/2308.14144
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.