Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Gesundheitswissenschaften# Gesundheitsinformatik

Vorhersage von Lungenfunktionsänderungen bei SSc-ILD-Patienten mithilfe von maschinellem Lernen

Diese Studie untersucht, wie maschinelles Lernen Veränderungen der Lungenfunktion bei SSc-ILD vorhersagen kann.

― 7 min Lesedauer


Maschinelles Lernen beiMaschinelles Lernen beiLungenerkrankungenSSc-ILD-Patienten.die Lungenfunktion beiFortgeschrittene Vorhersagemodelle für
Inhaltsverzeichnis

Systemische Sklerose (SSc) ist eine chronische Krankheit, die das Immunsystem betrifft und den Blutgefässen schadet. Das kann dazu führen, dass verschiedene Organe und Gewebe im Körper anders funktionieren. Ein ernsthaftes Problem, das durch SSc entstehen kann, ist die interstitielle Lungenerkrankung (ILD). ILD passiert, wenn sich zu viel Narbengewebe in der Lunge ansammelt, was es den Patienten schwer macht zu atmen. Das kann sich im Laufe der Zeit verschlimmern und ist ein häufiger Grund für Krankenhausbesuche und Sterbefälle bei Menschen mit SSc.

Da ILD ein grosses Problem für Leute mit SSc ist, sind regelmässige Untersuchungen wichtig. Ärzte überwachen die Lungenfunktion genau, um Veränderungen frühzeitig zu erkennen. Dieser Prozess beinhaltet normalerweise, detaillierte Bilder der Lunge zu machen und Tests durchzuführen, um die Funktion der Lunge zu bewerten.

Aktuelle Methoden zur Überwachung von Lungenerkrankungen

Aktuell nutzen Ärzte hochauflösende Computertomographie (HRCT)-Scans des Brustkorbs, um zu sehen, wie sehr die Lunge betroffen ist. Sie führen auch Lungenfunktionstests (PFTs) durch, um die Gesundheit der Lunge zu bewerten. Neu entwickelte Analysemethoden, die Informationen aus HRCT-Scans betrachten, haben vielversprechende Ergebnisse beim Vorhersagen der Lebensdauer von Patienten mit SSc-ILD ohne ernsthafte Gesundheitsprobleme gezeigt.

Eine andere Studie hat gezeigt, dass bestimmte Messungen, wie die forcierten Vitalkapazität (FVC) und die Fähigkeit der Lunge, Gase zu übertragen (DLCO), anzeigen können, wie sich ILD bei einzelnen Patienten entwickelt. Allerdings ist jeder Patient anders, und einige erleben eine schnellere Krankheitsprogression als andere, was zu höheren Komplikationsrisiken führt. Zu verstehen, wie sich die Lungenfunktion jedes Patienten im Laufe der Zeit verändert, ist entscheidend, um die beste Behandlung anzubieten.

Fortschritte bei der Vorhersage des Krankheitsverlaufs

Forscher haben nach Anzeichen oder Markern gesucht, die helfen können, vorherzusagen, wie sich SSc-ILD entwickeln wird. Einige Studien haben ein paar potenzielle Marker identifiziert, die bei der Vorhersage des Krankheitsverlaufs hilfreich sein könnten. Zum Beispiel haben einige Forscher ein Vorhersagemodell entwickelt, das darauf basiert, wie gut ein Patient geht und ob er bestimmte Gelenkprobleme hat. Andere Studien haben unterschiedliche Faktoren gefunden, wie z.B. das Geschlecht oder ob der Patient vorher kein Aspirin genommen hat, die mit dem Krankheitsverlauf in Verbindung stehen könnten.

Trotz dieser Fortschritte gibt es immer noch keinen sicheren Weg, um vorherzusagen, wie ILD auf individueller Ebene voranschreiten wird. Es gibt auch keinen Konsens darüber, wie oft Patienten gescreent werden sollten oder welche Methoden dafür am besten sind.

Die verschiedenen Ergebnisse könnten auf Unterschiede in den Patientengruppen zurückzuführen sein, die untersucht wurden. Ausserdem haben viele dieser Studien standardisierte Analysemethoden verwendet, die die Komplexität der Daten möglicherweise nicht erfassen. Mit dem Fortschritt der Technologie hat sich Maschinelles Lernen (ML) als mächtiges Werkzeug herausgestellt. Es hilft, nützliche Informationen aus grossen Datensätzen zu extrahieren, was bessere Einblicke in die Patientenversorgung bieten kann.

Wie maschinelles Lernen helfen kann

Methoden des maschinellen Lernens können komplexe Informationen analysieren und bei Entscheidungen helfen. Zum Beispiel haben Forscher ML erfolgreich genutzt, um die Entwicklung von Augenerkrankungen durch die Analyse genetischer und bildgebender Daten vorherzusagen. Sie haben es auch verwendet, um Patienten zu identifizieren, die ein Risiko für Herzkrankheiten haben, indem sie die Entwicklung von Plaque in Blutgefässen beurteilt haben. Ähnliche Methoden können auf SSc-ILD angewendet werden, um Veränderungen der Lungenfunktion im Laufe der Zeit vorherzusagen.

Unser Beitrag

In dieser Studie haben wir uns darauf konzentriert, zukünftige Lungenfunktionswerte bei Patienten mit SSc-ILD mithilfe von maschinellem Lernen vorherzusagen. Wir haben Zeitachsen für jeden Patienten erstellt, Informationen von ihren Besuchen gesammelt und die Reihenfolge der Ereignisse beibehalten. Unsere Hauptziele waren:

  1. Ein neues Modell zu entwickeln, das speziell dafür ausgelegt ist, Veränderungen der Lungenfunktion bei Patienten mit SSc-ILD zu verstehen.
  2. Unser neues Modell mit verschiedenen Standard-ML-Modellen zu vergleichen, um die Genauigkeit zu bewerten.
  3. Zu analysieren, wie bestimmte Faktoren die Genauigkeit unserer Vorhersagen beeinflussen können.
  4. Eine Methode zu testen, die die Unsicherheit in Vorhersagen verbessert.
  5. Zu bestimmen, welche Merkmale eine bedeutende Rolle in den Vorhersagen unseres Modells gespielt haben.

Datensammlung von Patienten

Wir haben eine grosse Datenbank verwendet, die Informationen von tausenden von Patienten enthält. Diese Datenbank umfasst Details zu ihrer Gesundheit, Demografie und klinischen Daten über mehrere Besuche hinweg. Für unsere Analyse haben wir Patienten einbezogen, die spezifische Kriterien erfüllten, wie z.B. Erwachsene mit diagnostizierter ILD, die durch bildgebende Tests bestätigt wurde, die aufgezeichnete Lungfunktionmessungen hatten und mehrere Besuche in der Klinik gemacht hatten.

Verständnis der Patiententrajektorien

Wir haben die gesammelten Daten in Patientenzeitleisten organisiert, sodass wir sehen konnten, wie sich der Zustand jedes Patienten im Laufe der Zeit entwickelt hat. Jeder Besuch trug zu einem klareren Bild der Gesundheit und Lungenfunktion des Patienten bei. Das Ziel war es, vergangene Besuche zu nutzen, um zukünftige Lungenfunktionswerte vorherzusagen.

Analyse der Patientenmerkmale

Unsere endgültige Studiengruppe bestand aus über 2000 Patienten, von denen die meisten Frauen waren, mit einem Durchschnittsalter von etwa 53 Jahren. Die Daten zeigten eine Vielzahl von Merkmalen, einschliesslich Alter, Geschlecht und Rauchgewohnheiten. Diese Merkmale halfen, weiteren Kontext zum Gesundheitszustand jedes Patienten zu bieten.

Modelle zur Krankheitsprogression

Mit den Zeitplandaten konzentrierten wir uns darauf, zukünftige Ergebnisse für Patienten basierend auf ihren vorherigen Besuchen vorherzusagen. Wir verwendeten mehrere Modellierungstechniken, darunter:

  • Rekurrente Neuronale Netze (RNN): Dieses Modell eignet sich hervorragend für den Umgang mit sequenziellen Daten wie unseren Patientenzeitleisten.
  • Transformator-Netzwerke: Ein weiteres fortschrittliches Modell, das die Bedeutung verschiedener Faktoren bei Vorhersagen hervorheben kann.
  • Aufmerksame Neuronale Prozesse (ANP): Dieses Modell wurde entwickelt, um effizient aus Daten zu lernen und Unsicherheitsabschätzungen für seine Vorhersagen bereitzustellen.

Messung der Vorhersagegenauigkeit

Wir haben verschiedene Methoden verwendet, um zu bewerten, wie gut unsere Modelle in Bezug auf die Genauigkeit abgeschnitten haben. Eine der wichtigsten Masse war der Wurzelmittelquadratfehler (RMSE), der uns half einzuschätzen, wie genau die Vorhersagen mit den tatsächlichen Ergebnissen übereinstimmten. Wir haben auch bewertet, wie verschiedene Faktoren die Vorhersagen beeinflussten.

Unsicherheit in Vorhersagen

Da wir verstanden haben, dass Vorhersagen nicht immer genau sein könnten, haben wir untersucht, wie unsere Modelle Unsicherheitsabschätzungen bereitstellen konnten. Zum Beispiel haben wir beurteilt, wie wahrscheinlich es war, dass die tatsächliche Lungenfunktion innerhalb eines bestimmten vorhergesagten Bereichs liegt. Diese Unsicherheitsabschätzung ist wichtig für Ärzte, um informierte Entscheidungen über die Patientenversorgung zu treffen.

Merkmalswichtigkeit in Vorhersagen

Wir haben analysiert, welche Merkmale in unseren Vorhersagen am einflussreichsten waren. Diese Analyse zeigte, dass frühere Lungenfunktionsmessungen und Faktoren wie das Ausmass der Hautbeteiligung, das Alter und bestimmte klinische Details eine bedeutende Rolle spielten. Diese Erkenntnisse können Kliniken helfen zu verstehen, welche Faktoren sie bei Patienten genau beobachten sollten.

Bedeutung der Behandlungsdokumentation

Eine bemerkenswerte Erkenntnis war die Bedeutung einer genauen Behandlungsdokumentation. Wir haben beobachtet, dass mit zunehmendem Mass an Therapiedokumentation die Vorhersagen der Modelle besser wurden. Das hebt die Notwendigkeit hervor, gründliche Aufzeichnungen im Gesundheitswesen zu führen, um effektivere Vorhersagemodelle in der Zukunft zu trainieren.

Fazit

Unsere Forschung zeigt das Potenzial, fortschrittliche Techniken des maschinellen Lernens zu nutzen, um Veränderungen der Lungenfunktion bei Patienten mit SSc-ILD vorherzusagen. Die Ergebnisse zeigten, dass sequenzielle Modelle die Standardmethoden übertrafen und genaue Einblicke in die Patiententrajektorien gaben. Dieser Ansatz verbessert nicht nur unser Verständnis davon, wie sich die Krankheit entwickeln könnte, sondern bietet auch wertvolle Werkzeuge für Gesundheitsdienstleister, um Patienten besser zu managen und zu behandeln. Durch die genaue Vorhersage zukünftiger Gesundheitszustände können wir informiertere Entscheidungen in der Patientenversorgung treffen und letztendlich die Lebensqualität derjenigen, die mit SSc-ILD leben, verbessern.

Originalquelle

Titel: Predicting Interstitial Lung Disease Progression in Patients with Systemic Sclerosis Using Attentive Neural Processes - A EUSTAR Study

Zusammenfassung: AO_SCPLOWBSTRACTC_SCPLOWO_ST_ABSBackgroundC_ST_ABSSystemic sclerosis (SSc) is an autoimmune disease with high mortality with lung involvement being the primary cause of death. Progressive interstitial lung disease (ILD) leads to a decline in lung function (forced vital capacity, FVC% predicted) with risk of respiratory failure. These patients could benefit from an early and tailored pharmacological intervention. However, up to date, tools for prediction of individual FVC changes are lacking. In this paper, we aimed at developing a trustworthy machine learning system that is able to guide SSc management by providing not only robust FVC predictions, but also uncertainty quantification (i.e. the degree of certainty of model prediction) as well as similarity-based explainability for any patient P (i.e. a list of past SSc patients with similar FVC trajectories like P). We further aimed to identify the key clinical factors influencing the models predictions and to use model-guided data representation to identify SSc patients with similar sequential FVC measurements. MethodsWe trained and evaluated machine learning (ML) models to predict SSc-ILD trajectory as measured by FVC% predicted values using the international SSc database managed by the European Scleroderma Trials and Research group (EUSTAR), which comprises clinical, laboratory and functional parameters. EUSTAR records patients data in annual assessment visits, and, given any visit, we aimed at predicting the FVC value of a patients subsequent visit, taking into account all available patient data (i.e. baseline and follow-up visit data up to the time point where we make the prediction). For training of our ML models, we included 2220 SSc patients that had at least 3 recorded visits in the EUSTAR database, were at least 18 years old, had confirmed ILD and sufficient clinical documentation. We developed sequential ML models implementing the attentive neural process formalism with either a recurrent (ANP RNN) or transformer encoder (ANP transformer) architecture. We compared these architectures with baseline sequential models including gated recurrent neural networks (RNNs) and multi-head self-attention transformer-based networks. Baseline non-sequential models included tree-based models such as gradient boosting trees, and regression-based models with varying regularization schemes. Our experiments used stratified 5-fold cross-validation to train and test the models using the average root mean squared error (RMSE), weighted RMSE, and mean absolute error (MAE) as performance metrics. We computed the coverage and Winkler score for uncertainty quantification, SHAP values for grading the input features importance and used the data embeddings of the ANP architectures for both similarity-based explainability and the identification of similar SSc patient journeys. ResultsPatients baseline FVC scores ranged from 22 to 150% predicted with a mean (SD) of 90.53% predicted (21.52). Our deep learning models showed better performance for FVC forecasting, compared to tree- and regression-based models. The top performing ANP RNN architecture was able to closely model future FVC values with average (SD) performance of 8.240 (0.168) weighted RMSE and 6.94 (0.190) MAE that was further used as feature generator for a logistic regression trained to predict a FVC% decline of at least 10% points achieving 0.704 AUC score. In comparison, a naive baseline using the mean FVC value as a predictor achieved much lower FVC forecasting capabilities, with 18.718 (0.317) weighted RMSE, and 17.619 (0.599) MAE. SHAP value analysis indicated that prior FVC measurements, diffusion of carbon monoxide (DLCO) values, skin involvement, age, anti-centromere positivity, dyspnea and CRP-elevation contributed most to deep-learning-based FVC predictions. Regarding uncertainty quantification, ANP RNN achieved 79% coverage (i.e. the model would provide uncertainty estimates that included the true future FVC value in 79 out of 100 predictions) out of the box, and 90% using an additional conformal prediction module with an corresponding Winkler score of 892 (indicating the width of the uncertainty estimate plus penalty for mistakes), smaller than any other model at the same coverage level. We further demonstrate how the data abstraction provided by the ANP RNN model (embeddings) allows for deriving similar patient trajectories (for similarity-based explanation). ConclusionsOur study demonstrates the feasibility of FVC forecasting and thus the ability to predict ILD trajectories in individual SSc patients using deep learning. We show that model predictions can be paired with uncertainty quantification and similarity-based model explainability, which are crucial elements for deploying trustworthy ML algorithms. Our study is thus an important first step towards reliable automated ILD trajectory (i.e. FVC%) prediction system with potential clinical utility.

Autoren: Ahmed Allam, A. N. Horvath, M. Dittberner, C. Trottet, E. Siegert, V. Sobanski, P. Carreira Delgado, D. Lorenzo, V. Smith, S. Guiducci, N. Hunzelmann, A.-M. Hoffmann-Vold, S. Trugli, A. M. Gheorghiu, A. Svetlana, C. Ribi, M. Krauthammer, B. Maurer, EUSTAR Collaborators

Letzte Aktualisierung: 2024-04-26 00:00:00

Sprache: English

Quell-URL: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365

Quell-PDF: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel