Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Gesundheitswissenschaften# Gesundheitsinformatik

Augen Gesundheit durch Machine Learning voranbringen

Diese Studie entwickelt ein Modell zur Identifizierung von Netzhauterkrankungen mithilfe brasilianischer Bilddaten.

― 7 min Lesedauer


KI-Modell zur ErkennungKI-Modell zur Erkennungvon Augenerkrankungenerkennen.Netzhauterkrankungen mit KI-Tools zuEin Modell entwickeln, um
Inhaltsverzeichnis

Medizinische Bildgebung wird immer fortschrittlicher und produziert eine Menge Daten, die Ärzte verstehen müssen. Leider gibt's nicht genug ausgebildete Fachleute, um diese Bilder zu interpretieren, was den Diagnosierungs- und Behandlungsprozess verlangsamen kann. Maschinelles Lernen und künstliche Intelligenz sind Werkzeuge, die helfen können, die medizinische Versorgung besser, schneller und günstiger zu machen, besonders im Bereich der Augengesundheit.

In der Augenheilkunde werden verschiedene Arten von Bildern gesammelt, um Krankheiten zu identifizieren und zu überwachen. Dazu gehören Netzhautbilder, optische Kohärenztomographie und andere. Obwohl diese Bildgebungstechnologien weit verbreitet sind, gibt's immer noch nicht genug Spezialisten, um die Bilder zu interpretieren und die Patienten an die richtige Behandlung zu leiten. Dieses Problem wird drängender, da immer mehr Menschen mit ernsthaften Augenerkrankungen diagnostiziert werden, und die Netzhautbildgebung ist ein wichtiges Bewertungswerkzeug.

Länder mit mehr Ressourcen haben in der Regel mehr ausgebildete Fachkräfte und Technologie, um grosse Mengen an Bilddaten zu verwalten. Aber in einkommensschwachen und mittelständischen Ländern fehlt oft diese Expertise, was eine Lücke in der Augenpflege schafft. Tatsächlich arbeiten die meisten Augenärzte nur in wenigen Ländern, wodurch viele Gebiete eingeschränkten Zugang zu Spezialisten haben.

Die Daten, die für das Training von Maschinenlernmodellen verwendet werden, stammen meist aus wohlhabenden Ländern. Das bedeutet, dass die Daten möglicherweise nicht die vielfältigen Bevölkerungen oder eine Vielzahl von Augenerkrankungen genau repräsentieren, was zu Problemen führen kann, wenn man diese Modelle in unterschiedlichen Umgebungen anwendet.

Die Netzhautbildgebung ist eine kostengünstige Möglichkeit zur Diagnose von Augenerkrankungen. Die Integration von KI in diesen Prozess zeigt vielversprechende Ergebnisse, wobei viele bestehende Projekte sich auf die Identifizierung einiger spezifischer Erkrankungen konzentrieren. In dieser Studie arbeiten wir daran, ein Modell zu entwickeln, das automatisch ein Spektrum von Netzhauterkrankungen aus Bildern identifizieren kann, die in Brasilien gesammelt wurden, einem Gebiet, das bisher nicht gut erforscht wurde.

Methoden

Wir haben einen Datensatz namens Brazilian Multilabel Ophthalmological Dataset verwendet, der mehr als 16.000 Bilder von Tausenden von Patienten umfasst. Dieser Datensatz wurde in drei verschiedenen Augenpflegezentren in Brasilien gesammelt. Für jeden Patienten wurde nur ein Bild mit Fokus auf die Makula aufgenommen. Die Bilder wurden mit speziellen Kameras von geschultem Personal gemacht.

Um den Datensatz vorzubereiten, haben wir persönliche und sensible Informationen von den Bildern entfernt. Ausserdem wurden Bilder ausgeschlossen, die nicht auf die relevanten Teile des Auges fokussiert waren. Nur Bilder, die bestimmte Merkmale der Netzhaut deutlich zeigten, wurden behalten. Das sorgt dafür, dass unser Datensatz konsistent und nützlich für das Training unseres Modells ist.

Zusätzlich zu den Bildern haben wir auch einige grundlegende Informationen über die Patienten gesammelt, wie Alter und medizinische Vorgeschichte. Wir haben uns jedoch entschieden, diese zusätzlichen Informationen nicht für das Training unseres Modells zu verwenden. Wir wollten sehen, wie gut das Modell nur mit den Bildern selbst abschneiden kann.

Der Datensatz enthält Bilder in unterschiedlicher Qualität. Jedes Bild wird basierend auf Fokussierung, Klarheit und anderen Faktoren als zufriedenstellend oder unzufriedenstellend bewertet. Trotz einiger als unzufriedenstellend gekennzeichneter Bilder haben wir sie in unser Training einbezogen, um das Modell an reale Szenarien anzupassen, in denen die Bildqualität variieren kann.

Jedes Bild wurde von einem Augenfacharzt beschriftet, der verschiedene Erkrankungen identifiziert hat, die im Bild vorhanden sind. Dieser Beschriftungsprozess wurde sorgfältig eingerichtet, um Genauigkeit sicherzustellen. Wir haben zusammengefasst, wie oft jede Erkrankung im Datensatz auftauchte.

Modellentwicklung

Wir haben die Bilder standardisiert, um eine konsistente Grösse für die Verarbeitung zu haben. Während des Trainings haben wir verschiedene Techniken verwendet, um die Vielfalt der Bilder künstlich zu erhöhen, wie z.B. Drehungen oder Spiegelungen. Das hilft dem Modell, besser zu lernen, indem es verschiedene Perspektiven desselben Bildes sieht.

Der Datensatz hatte ein grosses Ungleichgewicht zwischen der Anzahl der Bilder, die gesunde Augen zeigen, und denen, die Krankheiten zeigen. Um dem entgegenzuwirken, haben wir verschiedene Methoden ausprobiert, einschliesslich des Unter-Abtastens der Mehrheit, um den Datensatz besser auszubalancieren.

Wir haben auf eine Deep-Learning-Technik gesetzt, die ein spezielles neuronales Netzwerk namens Convolutional Neural Network (CNN) verwendet. Das ResNet-50-Modell wurde aufgrund seiner Effektivität bei der Verarbeitung von Bilddaten ausgewählt. Dieses Modell hat mehrere Schichten, die ihm helfen, wichtige Merkmale aus den Bildern zu lernen.

Um unser Modell zu trainieren, haben wir die Bilder in einem 60-20-20-Verhältnis für Training, Validierung und Test aufgeteilt. Wir haben einen Prozess verwendet, um die besten Schwellenwerte zur Vorhersage von Krankheiten basierend auf den Ausgaben des Modells zu bestimmen.

Ausserdem haben wir getestet, wie gut unser Modell funktionieren würde, wenn es auf Bildern von einem Kameratyp trainiert und dann auf Bildern von einer anderen Kamera getestet wurde. Das half uns zu verstehen, wie anpassungsfähig unser Modell an verschiedene Datenquellen ist.

Ergebnisse

Nach mehreren Trainingsrunden haben wir die besten Parameter für unser Modell festgelegt. Es zeigte starke Leistung bei der Identifizierung mehrerer Arten von Augenerkrankungen. Das Modell performte besonders gut mit Erkrankungen, die mehr Bilder in unserem Datensatz hatten. Krankheiten wie diabetische Retinopathie und Makulödem waren für das Modell leichter zu identifizieren.

Auf der anderen Seite gab es einige Erkrankungen, die das Modell schwer erkennen konnte, weil sie im Datensatz weniger vorkamen. Beispiele dafür sind Netzhautablösung, von denen es nur wenige Bilder gab, was zu schlechteren Identifikationsergebnissen führte.

Wir haben auch erkannt, dass das Modell mit der Kategorie "Sonstiges" Schwierigkeiten hatte, die verschiedene Krankheiten umfasste. Diese Diversität könnte das Modell verwirrt haben, wodurch es schwierig wurde, zwischen den verschiedenen dargestellten Erkrankungen zu unterscheiden. In Zukunft könnte es hilfreich sein, diese Bilder mit spezifischeren Erkrankungen zu kennzeichnen, um die Genauigkeit des Modells zu verbessern.

Um das Ungleichgewicht in unserem Datensatz weiter anzugehen, haben wir mehrere Experimente durchgeführt. In einem Fall haben wir eine signifikante Anzahl gesunder Bilder entfernt, um zu sehen, ob das die Leistung des Modells verbessert. Das Entfernen dieser Bilder führte tatsächlich zu einer leichten Verbesserung.

Wir haben auch versucht, einige der weniger häufig vertretenen Erkrankungen in eine breitere "Sonstige"-Kategorie zu kombinieren. Dieser Ansatz führte jedoch nicht zu bedeutenden Leistungsverbesserungen.

Zuletzt haben wir untersucht, ob wir eine Ensemble-Methode verwenden können, um die Ausgaben verschiedener Modelle zu kombinieren, um zu sehen, ob das die Genauigkeit verbessert. Obwohl wir einige kleine Fortschritte sahen, könnte die zusätzliche Komplexität in der Gesundheitsversorgung nicht gerechtfertigt sein.

Fazit

Diese Studie hatte das Ziel, ein Modell zur Identifizierung eines Spektrums von Netzhauterkrankungen mithilfe von Bildern zu entwickeln, die in Brasilien gesammelt wurden. Wir haben gezeigt, dass ein ResNet-50-Modell mit den richtigen Techniken diese Krankheiten effektiv klassifizieren kann. Unsere Arbeit hebt das Potenzial von KI-Tools in der Augenheilkunde hervor, besonders in Regionen, wo es an ausgebildeten Spezialisten mangelt.

Wir haben gelernt, dass die Leistung des Modells davon abhängt, wie viele Beispiele jeder Erkrankung in den Trainingsdaten verfügbar sind. Insgesamt schneidet unser Modell bei häufigeren Erkrankungen gut ab, hat jedoch Schwierigkeiten bei selteneren.

In Zukunft gibt es Potenzial, auf diesem grundlegenden Modell aufzubauen, indem komplexere Modelle ausprobiert und unterschiedliche Datensätze genutzt werden. Solche Fortschritte könnten zu noch effektiveren Werkzeuge für die Diagnose von Augenerkrankungen führen, den Zugang zur Versorgung verbessern und letztendlich die Ergebnisse für die Patienten steigern.

Die Kombination unseres Modells mit anderen, die auf verschiedenen Krankheiten trainiert wurden, könnte ein robusteres Diagnosetool schaffen. Dies könnte besonders vorteilhaft in ressourcenschwachen Umgebungen sein, wo schnelle Screenings und Behandlungen entscheidend sind. Indem wir diese Arbeit fortsetzen, hoffen wir, zu besseren Ergebnissen in der Augengesundheit weltweit beizutragen.

Originalquelle

Titel: Deep Learning for Multi-Label Disease Classification of Retinal Images: Insights from Brazilian Data for AI Development in Lower-Middle Income Countries

Zusammenfassung: Retinal fundus imaging is a powerful tool for disease screening and diagnosis in opthalmology. With the advent of machine learning and artificial intelligence, in particular modern computer vision classification algorithms, there is broad scope for technology to improve accuracy, increase accessibility and reduce cost in these processes. In this paper we present the first deep learning model trained on the first Brazilian multi-label opthalmological datatset. We train a multi-label classifier using over 16,000 clinically-labelled fundus images. Across a range of 13 retinal diseases, we obtain frequency-weighted AUC and F1 scores of 0.92 and 0.70 respectively. Our work establishes a baseline model on this new dataset and furthermore demonstrates the applicability and power of artificial intelligence approaches to retinal fundus disease diagnosis in under-represented populations.

Autoren: Dewi S.W. Gould, J. Yang, D. A. Clifton

Letzte Aktualisierung: 2024-02-13 00:00:00

Sprache: English

Quell-URL: https://www.medrxiv.org/content/10.1101/2024.02.12.24302676

Quell-PDF: https://www.medrxiv.org/content/10.1101/2024.02.12.24302676.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel