Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Gastro-entérologie

Améliorer le diagnostic des maladies rares avec des données

Cette recherche montre comment les données peuvent accélérer le diagnostic des maladies rares.

― 7 min lire


Accélérer le diagnosticAccélérer le diagnosticdes maladies raresdiagnostic des maladies rares.Utiliser des données pour améliorer le
Table des matières

Les maladies rares, c'est pas simple. Même si elles touchent environ 10% des gens quand on regarde ensemble, chacune d'elles est en fait super rare. Du coup, beaucoup de médecins n'ont pas l'expérience nécessaire pour les identifier. Les patients qui souffrent de ces maladies attendent souvent longtemps, parfois des années, avant d'avoir un bon diagnostic. Cette attente peut entraîner des tests inutiles, des traitements qui fonctionnent pas ou qui peuvent même empirer la situation, et une dégradation de leur qualité de vie. Ces retards ont aussi des répercussions plus larges sur la société, comme une perte de productivité et des coûts de santé en hausse.

Un exemple à noter : La Porphyrie Hépatique Aiguë (PHA)

Un exemple de maladie rare, c'est la Porphyrie Hépatique Aiguë (PHA). C'est un groupe de maladies héréditaires qui affecte la façon dont le corps fabrique l'hème, une partie de l'hémoglobine dans les globules rouges. Quand quelqu'un a la PHA, il peut ressentir des douleurs sévères pendant des épisodes causés par l'accumulation de certaines substances chimiques dans le corps. Ces épisodes peuvent entraîner des dommages neurologiques, et les personnes ayant des épisodes répétés risquent de grosses complications qui peuvent affecter leur système nerveux, leur foie et leurs reins.

La PHA est assez rare ; elle touche environ 1 personne sur 100 000. Comme c'est tellement rare, beaucoup de patients peuvent passer en moyenne 15 ans sans un bon diagnostic. Cette longue attente peut laisser les gens avec des problèmes de santé significatifs et une qualité de vie plus faible. Heureusement, un nouveau traitement est dispo, offrant aux gens une meilleure chance de gérer leur condition efficacement. Mais réduire le temps pour obtenir un diagnostic, c'est toujours crucial pour de meilleurs résultats.

Le rôle des données dans le diagnostic

Les nouvelles technologies, notamment l'apprentissage machine et les Dossiers de santé électroniques (DSE), offrent de l'espoir pour accélérer le diagnostic des maladies rares comme la PHA. Les DSE contiennent une mine d'infos sur les patients, y compris leurs symptômes, diagnostics précédents, et traitements essayés avant d'arriver à un bon diagnostic. En analysant ces données, des modèles d'apprentissage machine peuvent être formés pour identifier les patients qui pourraient avoir la PHA ou des conditions similaires beaucoup plus tôt.

Mais construire ces modèles, c'est pas facile. Comme la PHA est rare, il peut y avoir trop peu de cas et trop d'exemples d'autres conditions, ce qui peut embrouiller le processus d'apprentissage. De plus, les données des DSE s'accumulent avec le temps, ce qui complique comment les patients naviguent dans le système de santé. Il est super important de s'assurer que les modèles n'utilisent pas trop d'infos du futur pour prédire le passé.

Développer une approche d'apprentissage machine

Pour s'attaquer au problème des longs temps de diagnostic dans la PHA, une nouvelle approche d'apprentissage machine (AM) a été conçue. En utilisant des données de deux centres médicaux, l'équipe a formé des modèles pour prédire quels patients pourraient être testés pour la PHA et lesquels d'entre eux pourraient réellement être positifs pour la condition. Après la construction de ces modèles, ils ont été évalués pour voir leur efficacité dans des scénarios réels.

Un modèle a été créé pour visualiser le parcours du patient vers un diagnostic de PHA. Ce parcours implique deux points de décision principaux : d'abord, si un patient va être orienté pour des tests, et ensuite, s'il va obtenir un diagnostic confirmé. Il est important de noter que différents facteurs influencent ces décisions, et des modèles ont été développés séparément pour chaque étape.

Comprendre le parcours du patient

Le parcours du patient vers un diagnostic peut être influencé par plusieurs variables. Ça peut inclure à quelle fréquence le patient consulte des médecins, le niveau de connaissance des prestataires de soins, et la volonté du patient de suivre les conseils médicaux. L'étude a identifié deux gros "goulots d'étranglement" dans ce parcours : la chance qu'un patient soit orienté vers des tests spécialisés pour la PHA et la probabilité qu'un patient testé reçoive un diagnostic confirmé.

Pour préparer les données pour le modélisation, les infos des DSE des deux centres ont été organisées. Les données comprenaient à la fois des infos structurées, comme des diagnostics et des tests de laboratoire, et des infos non structurées, comme les notes des médecins. Différentes méthodes ont été appliquées pour donner un sens aux données non structurées, et des caractéristiques qui pourraient aider à prédire les diagnostics ont été sélectionnées en utilisant des techniques statistiques et des connaissances issues de la littérature médicale.

Entraîner les modèles

Chaque ensemble de données se concentrait sur une tâche différente : l'un visait à prédire qui serait orienté pour des tests de PHA, tandis que l'autre se concentrait sur qui serait positif après avoir subi des tests. Les modèles ont été entraînés, évalués, et améliorés en fonction de leur performance en utilisant différents frameworks d'apprentissage machine.

Pendant le processus d'entraînement, il a été noté que plus de patients avaient été identifiés comme ayant été orientés pour des tests que ceux qui avaient réellement terminé les tests. Ça pourrait indiquer un écart dans le système de santé où beaucoup de patients sont conseillés de se faire tester mais ne le font pas, souvent pour différentes raisons personnelles ou systémiques.

Évaluer la performance des modèles

Les modèles ont montré des résultats prometteurs lors des tests. De bons scores ont été atteints pour prédire à la fois les orientations et les diagnostics positifs de la PHA. Les meilleurs modèles pourraient potentiellement aider à identifier les patients qui pourraient avoir la maladie beaucoup plus tôt que leurs dates de diagnostic réelles.

En fait, en appliquant rétroactivement les modèles, il a été constaté qu'une partie significative des patients aurait pu être diagnostiquée plus tôt, avec une réduction moyenne du temps de 1,2 an.

Défis de tests en conditions réelles

Malgré les résultats prometteurs, l'équipe a fait face à des défis en essayant de valider les modèles dans des contextes réels. Engager les patients à participer à l'étude a été compliqué, surtout étant donné que la PHA est une maladie rare et que beaucoup de patients peuvent ne pas être facilement accessibles. Seulement une petite fraction des patients contactés a accepté de participer, et les tests réalisés n'ont donné aucun résultat positif pour la PHA.

Cependant, ça ne diminue pas la nature prometteuse de la recherche. Les résultats indiquent toujours que l'utilisation des données des DSE pour développer des modèles d'apprentissage machine peut aider à rendre le processus de diagnostic plus efficace, surtout pour les maladies rares.

Implications pour les recherches futures

Ce travail s'ajoute à un corpus de recherche qui cherche à améliorer la prédiction et le diagnostic des maladies rares. Bien que l'étude ait rencontré des limites, elle a aussi mis en avant le pouvoir des données des DSE pour prendre des décisions cliniques et améliorer les résultats pour les patients. L'objectif pour l'avenir est de peaufiner ces modèles, de les valider dans des populations plus larges et plus diversifiées, et de développer des outils d'aide à la décision pour soutenir les prestataires de soins de santé.

En résumé, le projet visait à s'attaquer au problème complexe du diagnostic rapide pour les maladies rares. Bien qu'il reste du travail à faire, le potentiel de l'apprentissage machine et de l'intégration des données pour changer la façon dont les conditions rares sont diagnostiquées et traitées est significatif. En améliorant la détection précoce, les patients peuvent recevoir les soins dont ils ont besoin plus tôt, ce qui pourrait mener à de meilleurs résultats de santé.

Source originale

Titre: Reducing diagnostic delays in Acute Hepatic Porphyria using electronic health records data and machine learning: a multicenter development and validation study

Résumé: ImportanceAcute Hepatic Porphyria (AHP) is a group of rare but treatable conditions associated with diagnostic delays of fifteen years on average. The advent of electronic health records (EHR) data and machine learning (ML) may improve the timely recognition of rare diseases like AHP. However, prediction models can be difficult to train given the limited case numbers, unstructured EHR data, and selection biases intrinsic to healthcare delivery. ObjectiveTo train and characterize models for identifying patients with AHP. Design, Setting, and ParticipantsThis diagnostic study used structured and notes-based EHR data from two centers at the University of California, UCSF (2012-2022) and UCLA (2019-2022). The data were split into two cohorts (referral, diagnosis) and used to develop models that predict: 1) who will be referred for testing of acute porphyria, amongst those who presented with abdominal pain (a cardinal symptom of AHP), and 2) who will test positive, amongst those referred. The referral cohort consisted of 747 patients referred for testing and 99,849 contemporaneous patients who were not. The diagnosis cohort consisted of 72 confirmed AHP cases and 347 patients who tested negative. Cases were female predominant and 6-75 years old at the time of diagnosis. Candidate models used a range of architectures. Feature selection was semi-automated and incorporated publicly available data from knowledge graphs. Main Outcomes and MeasuresF-score on an outcome-stratified test set ResultsThe best center-specific referral models achieved an F-score of 86-91%. The best diagnosis model achieved an F-score of 92%. To further test our model, we contacted 372 current patients who lack an AHP diagnosis but were predicted by our models as potentially having it ([≥] 10% probability of referral, [≥] 50% of testing positive). However, we were only able to recruit 10 of these patients for biochemical testing, all of whom were negative. Nonetheless, post hoc evaluations suggested that these models could identify 71% of cases earlier than their diagnosis date, saving 1.2 years. Conclusions and RelevanceML can reduce diagnostic delays in AHP and other rare diseases. Robust recruitment strategies and multicenter coordination will be needed to validate these models before they can be deployed. KEY POINTSO_ST_ABSQuestionC_ST_ABSCan machine learning help identify undiagnosed patients with Acute Hepatic Porphyria (AHP), a group of rare diseases? FindingsUsing electronic health records (EHR) data from two centers we developed models to predict: 1) who will be referred for AHP testing, and 2) who will test positive. The best models achieved 89-93% accuracy on the test set. These models appeared capable of recognizing 71% of the cases earlier than their true diagnosis date, reducing diagnostic delays by an average of 1.2 years. MeaningMachine learning models trained using EHR data can help reduce diagnostic delays in rare diseases like AHP.

Auteurs: Vivek Ashok Rudrapatna, B. Bhasuran, K. Schmolly, Y. Kapoor, N. Jayakumar, R. Doan, J. Amin, S. Meninger, N. Cheng, R. Deering, K. Anderson, S. Beaven, B. Wang

Dernière mise à jour: 2023-08-31 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2023.08.30.23293130

Source PDF: https://www.medrxiv.org/content/10.1101/2023.08.30.23293130.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires