Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Informatique de santé

Prédire les changements de fonction pulmonaire chez les patients SSc-ILD en utilisant l'apprentissage automatique

Cette étude explore comment l'apprentissage machine peut prédire les changements de fonction pulmonaire dans la fibrose pulmonaire liée à la sclérodermie.

― 8 min lire


Apprentissage automatiqueApprentissage automatiquedans les maladiespulmonairesSSc-ILD.fonction pulmonaire chez les patientsModèles de prédiction avancés pour la
Table des matières

La Sclérose Systémique (SSc) est une maladie de longue durée qui touche le système immunitaire et endommage les vaisseaux sanguins. Elle peut provoquer des changements dans le fonctionnement de divers organes et tissus dans le corps. Un problème sérieux qui peut survenir à cause de la SSc est une condition appelée Maladie pulmonaire interstitielle (ILD). L'ILD se produit quand trop de tissu cicatriciel s'accumule dans les poumons, rendant la respiration difficile pour les patients. Cela peut empirer avec le temps et c'est une raison fréquente pour des visites à l'hôpital et des décès chez les personnes atteintes de SSc.

Comme l'ILD représente un gros souci pour les gens avec SSc, des contrôles réguliers sont super importants. Les médecins surveillent de près la fonction pulmonaire pour déceler tout changement le plus tôt possible. Ce processus implique généralement de prendre des images détaillées des poumons et de faire des tests pour évaluer leur fonctionnement.

Méthodes Actuelles pour Surveiller les Maladies Pulmonaires

En ce moment, les médecins utilisent des scans par tomographie à haute résolution (HRCT) du thorax pour voir à quel point les poumons sont affectés. Ils réalisent aussi des Tests de fonction pulmonaire (PFT) pour évaluer la santé des poumons. De nouvelles méthodes d'analyse qui examinent les données issues des scans HRCT ont montré qu'elles pouvaient aider à prédire combien de temps les patients avec SSc-ILD pourraient vivre sans problèmes de santé graves.

Une autre étude a montré que certaines mesures, comme la capacité vital forcée (FVC) et la capacité des poumons à transférer des gaz (DLCO), peuvent indiquer comment l'ILD progresse chez chaque patient. Mais chaque patient est unique, et certains connaissent une progression plus rapide de la maladie que d'autres, augmentant ainsi les risques de complications. Comprendre comment la fonction pulmonaire de chaque patient change au fil du temps est crucial pour assurer les meilleurs soins.

Avancées dans la Prédiction de la Progression de la Maladie

Les chercheurs cherchent des signes ou des marqueurs qui peuvent aider à prédire comment l'ILD de la SSc évoluera. Certaines études ont identifié quelques marqueurs potentiels qui pourraient aider à prévoir la progression de la maladie. Par exemple, certains chercheurs ont élaboré un modèle de prédiction basé sur la façon dont un patient marche et s'il a des problèmes articulaires. D'autres études ont trouvé différents facteurs, comme être un homme ou ne pas avoir pris d'aspirine auparavant, qui pourraient être liés à la progression de la maladie.

Malgré ces avancées, il n'existe toujours pas de moyen définitif de prédire comment l'ILD progressera au niveau individuel. Il n'y a pas non plus de consensus sur la fréquence à laquelle les patients devraient être dépistés ou les meilleures méthodes pour le faire.

Les diverses découvertes peuvent être dues à des différences dans les groupes de patients étudiés. En plus, beaucoup de ces études ont utilisé des techniques d'analyse standard qui pourraient ne pas rendre compte de la complexité des données. Avec l'avancée de la technologie, l'Apprentissage automatique (ML) est devenu un outil puissant. Il aide à extraire des informations utiles à partir de grandes bases de données, ce qui peut offrir de meilleurs aperçus pour le soin des patients.

Comment l'Apprentissage Automatique Peut Aider

Les méthodes d'apprentissage automatique peuvent analyser des informations complexes et aider à prendre des décisions. Par exemple, les chercheurs ont réussi à utiliser le ML pour prédire le développement de maladies oculaires en analysant des données génétiques et d'imagerie. Ils l'ont aussi utilisé pour identifier les patients à risque de maladies cardiaques en évaluant l'évolution du plaque dans les vaisseaux sanguins. Des méthodes similaires peuvent être appliquées à l'ILD de la SSc pour prédire les changements de la fonction pulmonaire au fil du temps.

Notre Contribution

Dans cette étude, nous nous sommes concentrés sur la prédiction des valeurs futures de la fonction pulmonaire chez les patients avec SSc-ILD en utilisant l'apprentissage automatique. Nous avons créé des timelines pour chaque patient, rassemblant des informations de leurs visites et préservant l'ordre des événements. Nous avons voulu aborder plusieurs objectifs principaux :

  1. Développer un nouveau modèle spécifiquement conçu pour comprendre les changements de la fonction pulmonaire chez les patients avec SSc-ILD.
  2. Comparer notre nouveau modèle à divers modèles ML standards pour évaluer sa précision.
  3. Analyser comment certains facteurs peuvent influencer la précision de nos prédictions.
  4. Tester une méthode qui améliore l'incertitude dans les prédictions.
  5. Déterminer quelles caractéristiques ont joué des rôles significatifs dans les prédictions de notre modèle.

Collecte de Données auprès des Patients

Nous avons utilisé une grande base de données contenant des informations de milliers de patients. Cette base inclut des détails sur leur santé, des informations démographiques et des données cliniques sur plusieurs visites. Pour notre analyse, nous avons inclus des patients qui répondaient à des critères spécifiques, comme être des adultes avec un ILD diagnostiqué confirmé par des tests d'imagerie, ayant enregistré des mesures de la fonction pulmonaire et ayant fait plusieurs visites à la clinique.

Comprendre les Trajectoires des Patients

Nous avons organisé les données collectées en timelines de patients, ce qui nous a permis de voir comment l'état de chaque patient évoluait avec le temps. Chaque visite a contribué à une image plus claire de la santé et de la fonction pulmonaire du patient. L'objectif était d'utiliser les visites passées pour prédire les résultats futurs de la fonction pulmonaire.

Analyser les Caractéristiques des Patients

Notre groupe d'étude final se composait de plus de 2000 patients, dont la plupart étaient des femmes, avec un âge moyen d'environ 53 ans. Les données montraient une variété de caractéristiques, y compris l'âge, le sexe et les habitudes de tabagisme. Ces caractéristiques ont aidé à fournir un contexte supplémentaire pour comprendre la santé de chaque patient.

Modèles de Progression de la Maladie

En utilisant les données des timelines, nous nous sommes concentrés sur la prédiction des résultats futurs pour les patients basés sur leurs visites précédentes. Nous avons utilisé plusieurs techniques de modélisation, notamment :

  • Réseaux de Neurones Récurrents (RNN) : Ce type de modèle est excellent pour traiter des données séquentielles comme nos timelines de patients.
  • Réseaux de Transformateurs : Un autre modèle avancé qui peut mettre en avant l'importance de différents facteurs dans les prédictions.
  • Processus Neurones Attentifs (ANP) : Ce modèle est conçu pour apprendre efficacement à partir des données et fournir des estimations d'incertitude pour ses prédictions.

Mesurer la Précision des Prédictions

Nous avons utilisé diverses méthodes pour évaluer la performance de nos modèles en termes de précision. Une des mesures clés était l'Erreur Quadratique Moyenne (RMSE), qui nous a aidés à jauger à quel point les prédictions correspondaient aux résultats réels. Nous avons également évalué comment différents facteurs ont influencé les prédictions.

Incertitude dans les Prédictions

Comprenant que les prédictions peuvent ne pas toujours être précises, nous avons examiné comment nos modèles pouvaient fournir des estimations d'incertitude. Par exemple, nous avons évalué à quel point il était probable que la fonction pulmonaire réelle tombe dans une certaine plage prédite. Cette estimation d'incertitude est importante pour que les médecins prennent des décisions éclairées sur les soins aux patients.

Importance des Caractéristiques dans les Prédictions

Nous avons analysé quelles caractéristiques étaient les plus influentes dans nos prédictions. Cette analyse a révélé que les mesures précédentes de la fonction pulmonaire et des facteurs comme l'étendue de l'implication cutanée, l'âge et certains détails cliniques jouaient des rôles significatifs. Ces aperçus peuvent aider les cliniciens à comprendre quels facteurs ils devraient surveiller de près chez les patients.

Importance de la Documentation des Traitements

Une découverte notable était l'importance d'une documentation précise des traitements. Nous avons observé qu'à mesure que le niveau de documentation des thérapies augmentait, les prédictions des modèles s'amélioraient. Cela souligne le besoin d'une tenue de dossier minutieuse dans les soins de santé pour aider à former des modèles de prédiction plus efficaces à l'avenir.

Conclusion

Notre recherche démontre le potentiel d'utiliser des techniques avancées d'apprentissage automatique pour prédire les changements de fonction pulmonaire chez les patients avec SSc-ILD. Les résultats ont montré que les modèles séquentiels surpassaient les méthodes standards, offrant des aperçus précis sur les trajectoires des patients. Cette approche non seulement améliore notre compréhension de l'évolution de la maladie, mais elle fournit aussi des outils précieux pour les prestataires de soins de santé afin de gérer et traiter les patients plus efficacement. En prédisant avec précision les résultats de santé futurs, nous pouvons prendre des décisions plus éclairées dans les soins aux patients, améliorant ainsi la qualité de vie de ceux qui vivent avec SSc-ILD.

Source originale

Titre: Predicting Interstitial Lung Disease Progression in Patients with Systemic Sclerosis Using Attentive Neural Processes - A EUSTAR Study

Résumé: AO_SCPLOWBSTRACTC_SCPLOWO_ST_ABSBackgroundC_ST_ABSSystemic sclerosis (SSc) is an autoimmune disease with high mortality with lung involvement being the primary cause of death. Progressive interstitial lung disease (ILD) leads to a decline in lung function (forced vital capacity, FVC% predicted) with risk of respiratory failure. These patients could benefit from an early and tailored pharmacological intervention. However, up to date, tools for prediction of individual FVC changes are lacking. In this paper, we aimed at developing a trustworthy machine learning system that is able to guide SSc management by providing not only robust FVC predictions, but also uncertainty quantification (i.e. the degree of certainty of model prediction) as well as similarity-based explainability for any patient P (i.e. a list of past SSc patients with similar FVC trajectories like P). We further aimed to identify the key clinical factors influencing the models predictions and to use model-guided data representation to identify SSc patients with similar sequential FVC measurements. MethodsWe trained and evaluated machine learning (ML) models to predict SSc-ILD trajectory as measured by FVC% predicted values using the international SSc database managed by the European Scleroderma Trials and Research group (EUSTAR), which comprises clinical, laboratory and functional parameters. EUSTAR records patients data in annual assessment visits, and, given any visit, we aimed at predicting the FVC value of a patients subsequent visit, taking into account all available patient data (i.e. baseline and follow-up visit data up to the time point where we make the prediction). For training of our ML models, we included 2220 SSc patients that had at least 3 recorded visits in the EUSTAR database, were at least 18 years old, had confirmed ILD and sufficient clinical documentation. We developed sequential ML models implementing the attentive neural process formalism with either a recurrent (ANP RNN) or transformer encoder (ANP transformer) architecture. We compared these architectures with baseline sequential models including gated recurrent neural networks (RNNs) and multi-head self-attention transformer-based networks. Baseline non-sequential models included tree-based models such as gradient boosting trees, and regression-based models with varying regularization schemes. Our experiments used stratified 5-fold cross-validation to train and test the models using the average root mean squared error (RMSE), weighted RMSE, and mean absolute error (MAE) as performance metrics. We computed the coverage and Winkler score for uncertainty quantification, SHAP values for grading the input features importance and used the data embeddings of the ANP architectures for both similarity-based explainability and the identification of similar SSc patient journeys. ResultsPatients baseline FVC scores ranged from 22 to 150% predicted with a mean (SD) of 90.53% predicted (21.52). Our deep learning models showed better performance for FVC forecasting, compared to tree- and regression-based models. The top performing ANP RNN architecture was able to closely model future FVC values with average (SD) performance of 8.240 (0.168) weighted RMSE and 6.94 (0.190) MAE that was further used as feature generator for a logistic regression trained to predict a FVC% decline of at least 10% points achieving 0.704 AUC score. In comparison, a naive baseline using the mean FVC value as a predictor achieved much lower FVC forecasting capabilities, with 18.718 (0.317) weighted RMSE, and 17.619 (0.599) MAE. SHAP value analysis indicated that prior FVC measurements, diffusion of carbon monoxide (DLCO) values, skin involvement, age, anti-centromere positivity, dyspnea and CRP-elevation contributed most to deep-learning-based FVC predictions. Regarding uncertainty quantification, ANP RNN achieved 79% coverage (i.e. the model would provide uncertainty estimates that included the true future FVC value in 79 out of 100 predictions) out of the box, and 90% using an additional conformal prediction module with an corresponding Winkler score of 892 (indicating the width of the uncertainty estimate plus penalty for mistakes), smaller than any other model at the same coverage level. We further demonstrate how the data abstraction provided by the ANP RNN model (embeddings) allows for deriving similar patient trajectories (for similarity-based explanation). ConclusionsOur study demonstrates the feasibility of FVC forecasting and thus the ability to predict ILD trajectories in individual SSc patients using deep learning. We show that model predictions can be paired with uncertainty quantification and similarity-based model explainability, which are crucial elements for deploying trustworthy ML algorithms. Our study is thus an important first step towards reliable automated ILD trajectory (i.e. FVC%) prediction system with potential clinical utility.

Auteurs: Ahmed Allam, A. N. Horvath, M. Dittberner, C. Trottet, E. Siegert, V. Sobanski, P. Carreira Delgado, D. Lorenzo, V. Smith, S. Guiducci, N. Hunzelmann, A.-M. Hoffmann-Vold, S. Trugli, A. M. Gheorghiu, A. Svetlana, C. Ribi, M. Krauthammer, B. Maurer, EUSTAR Collaborators

Dernière mise à jour: 2024-04-26 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365

Source PDF: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires