Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Informatique de santé

Améliorer les prédictions de sortie d'hôpital avec l'apprentissage automatique

Une étude montre que des modèles de machine learning peuvent améliorer les prévisions de sortie d'hôpital.

― 10 min lire


Modèles de prédiction deModèles de prédiction desortie d'hôpitalprécision du timing de sortie.L'apprentissage machine améliore la
Table des matières

Les systèmes de santé à travers le monde sont sous de plus en plus de pression à cause de la hausse des demandes. Ça vient des changements démographiques, du fait qu'il y a plus de gens avec des maladies chroniques, des évolutions dans la société, et des avancées technologiques. Au Royaume-Uni, le Service National de Santé (NHS) a particulièrement ressenti ces pressions, avec plus de patients qui se rendent à l'hôpital, des temps d'attente plus longs aux Urgences, et des soucis financiers. La pandémie de COVID-19 a encore amplifié ces problèmes, entraînant des délais significatifs pour les soins médicaux urgents et de routine.

Étant donné que les ressources hospitalières sont limitées, les hôpitaux doivent trouver des moyens d'améliorer l'efficacité et de mieux gérer la capacité des patients. Une partie clé de ça, c'est de savoir comment gérer efficacement le flux des patients-c’est-à-dire guider les patients depuis leur entrée à l'hôpital jusqu'à leur sortie tout en s'assurant qu'ils reçoivent les soins adéquats.

L'Importance du Flux des Patients

Optimiser le flux des patients peut mener à de meilleures expériences pour les patients, moins d'attente pour les traitements, de meilleurs résultats de santé, et des économies de coûts. Un moyen important d'améliorer le flux des patients est de prédire avec précision quand les patients seront sortis. Ça veut dire que les prestataires de santé peuvent être alertés quand un patient est presque prêt à rentrer chez lui, leur permettant d'organiser le transport, de finaliser les médicaments de sortie, et de préparer la chambre d'hôpital pour le prochain patient.

Actuellement, les Prédictions de sorties se basent sur l'évaluation par les équipes cliniques de la situation de chaque patient selon son diagnostic et son état actuel. Cependant, ces prédictions peuvent souvent être inconsistantes et subjectives. Souvent, elles ne sont pas suivies dans les systèmes de dossiers de santé électroniques, ce qui peut compliquer les opérations hospitalières. Du coup, il y a un intérêt croissant pour utiliser des outils de prédiction automatisés pour prévoir la durée de séjour et le moment de sortie des patients.

Modèles de Prédiction de Sortie

La prédiction de la sortie est devenue un domaine de recherche pour les chercheurs utilisant des techniques d'apprentissage machine. Plusieurs études ont tenté de prévoir le moment des sorties basées sur des plages horaires définies, comme les prochaines 24, 48 ou 72 heures. Certaines études se sont concentrées sur des groupes spécifiques de patients, comme ceux subissant une chirurgie ou ceux avec des problèmes cardiaques, tandis que d'autres ont visé à prédire les sorties pour des hôpitaux entiers.

Différentes techniques d'apprentissage machine traditionnelles ont été testées, y compris les forêts aléatoires, les arbres boostés, et les réseaux de neurones. Les caractéristiques utilisées pour faire ces prédictions incluent généralement les données démographiques du patient, son histoire médicale, ses signes vitaux, ses diagnostics, ses procédures, et ses médicaments. Bien que certains modèles aient montré des résultats prometteurs, la plupart atteignent une performance moyenne, avec des taux de succès très variables d'une étude à l'autre.

Un exemple impressionnant est un modèle qui a inclus des données sur les interactions des cliniciens avec les dossiers de santé électroniques, atteignant une grande précision dans la prédiction des sorties dans les 24 heures. Cependant, il avait des limites, comme le fait d'inclure seulement les premières hospitalisations et d'exclure les patients qui n'avaient pas survécu à leur séjour. Beaucoup d'études existantes n'ont pas suffisamment abordé des domaines importants, comme l'impact de la taille des données d'entraînement, le timing des prédictions, et la performance par rapport à des groupes de patients spécifiques.

Objectifs de cette Étude

Dans cette étude, les chercheurs visaient à utiliser une grande quantité de données de dossiers de santé électroniques d'un groupe d'hôpitaux de formation au Royaume-Uni pour développer des modèles d'apprentissage machine qui peuvent prédire quels patients seront sortis dans les 24 heures suivantes. En combinant les prédictions individuelles, les modèles estimeraient également le nombre total de sorties attendues dans tout l'hôpital.

Données et Méthodologie

Source de Données

Les données provenaient de la Base de données de recherche sur les infections dans l'Oxfordshire (IORD), qui contient des dossiers de santé électroniques anonymisés des hôpitaux de la Fondation NHS des hôpitaux universitaires d'Oxford. Ce groupe comprend quatre hôpitaux d'enseignement, servant une population d'environ 755 000 personnes.

L'étude s'est concentrée sur les patients adultes hospitalisés du 1er février 2017 au 31 janvier 2020, en excluant des catégories spécifiques comme l'obstétrique et la pédiatrie. Les admissions ont été classées en deux groupes : électives (planifiées) et d'urgence (non planifiées).

Caractéristiques Utilisées dans les Prédictions

Les chercheurs ont identifié des caractéristiques potentielles pour les modèles en tenant compte des connaissances médicales existantes et des études précédentes. Ces caractéristiques comprenaient les données démographiques des patients, les diagnostics actuels, les admissions passées, les résultats de laboratoire, et l'historique des médicaments. L'objectif était de créer un ensemble de données solide qui pourrait informer les prédictions de sortie.

Tâche de Prédiction

L'étude s'est concentrée sur la prédiction si les patients seraient sortis de l'hôpital dans les 24 heures suivant une date et un heure spécifiées. Les prédictions au niveau individuel ont été agrégées pour fournir une estimation des sorties totales attendues dans l'hôpital pour cette période.

Différentes analyses de sensibilité ont été réalisées pour évaluer comment le timing des prédictions affectait les résultats. Les modèles ont été entraînés en utilisant des données historiques et évalués à l'aide de données plus récentes pour évaluer leur efficacité.

Développement du Modèle

Des modèles de Boosting par Gradient Extrême (XGB) ont été employés pour prédire les sorties. Les données d'entraînement couvraient les deux premières années de la période d'étude, tandis que l'évaluation utilisait des données de la dernière année. Les modèles ont subi un réglage des hyperparamètres pour maximiser leur performance.

L'implémentation du modèle a permis de gérer les données manquantes, car XGB pouvait gérer ces lacunes sans imputation. Les chercheurs ont calibré les probabilités de sortie prédites pour garantir leur exactitude.

Évaluation de la Performance

L'efficacité des modèles a été évaluée en utilisant divers critères, tels que la sensibilité, la spécificité, la valeur prédictive positive, la valeur prédictive négative, et l'exactitude globale. La performance des prédictions au niveau de l'hôpital a également été évaluée en comparant les nombres de sorties prédites aux nombres réels.

Au total, 52 590 admissions électives et 202 633 admissions d'urgence ont été enregistrées durant la période d'étude. Après filtrage pour les admissions courtes et en s'assurant des données pertinentes, un total de 48 039 admissions électives et 143 275 admissions d'urgence ont été incluses dans l'analyse.

Résultats

Performance du Modèle

Les modèles ont montré des résultats prometteurs dans la prédiction des sorties. Pour les admissions électives, le modèle a atteint une superficie sous la courbe (AUC) de 0,871, tandis que pour les admissions d'urgence, l'AUC était de 0,860. La valeur prédictive positive pour les admissions électives était de 0,555, et pour les admissions d'urgence, elle était de 0,571, indiquant que les modèles étaient efficaces pour identifier les patients susceptibles d'être sortis.

L'étude a également trouvé que la performance des modèles s'améliorait avec des ensembles de données d'entraînement plus grands, atteignant un point de saturation autour de 12 mois de données. De plus, les prédictions faites à midi ont donné la plus grande précision comparé à d'autres moments de la journée.

Importance des Caractéristiques

L'analyse a identifié des caractéristiques clés liées à la sortie des patients. Pour les admissions électives, les prédicteurs les plus importants incluaient le nombre de médicaments reçus dans les 24 dernières heures et si les patients avaient terminé leurs traitements antibiotiques. Pour les admissions d'urgence, des caractéristiques similaires ont joué un rôle important, montrant que l'historique des médicaments était essentiel dans la prévision des sorties.

Analyse par Sous-Groupe et Équité du Modèle

Les chercheurs ont évalué la performance du modèle à travers différents groupes démographiques, incluant le sexe, l'ethnicité, et le statut socio-économique. Bien que la performance générale soit constante, certaines variations ont été observées, notamment chez les patients plus âgés et ceux avec des séjours hospitaliers plus longs. Les modèles avaient tendance à moins bien performer dans ces sous-groupes, ce qui suggère que des besoins plus complexes peuvent ne pas être bien capturés dans les données.

Limites et Directions Futures

L'étude avait quelques limites. L'horizon de prédiction était seulement de 24 heures, ce qui peut restreindre la portée de planification pour les opérations hospitalières. De plus, les modèles se basaient uniquement sur des données de santé électroniques structurées, sans incorporer de données non structurées, ce qui pourrait améliorer l'exactitude des prédictions.

L'étude a conclu que bien que les modèles d'apprentissage machine actuels montrent du potentiel, il y a encore place à l'amélioration. Les futures initiatives devraient explorer l'intégration de données non structurées et affiner les techniques de modèles, comme l'utilisation d'approches d'apprentissage profond, pour améliorer encore plus les performances.

Conclusion

Intégrer l'apprentissage machine avec des données de dossiers de santé électroniques a le potentiel d'améliorer les opérations hospitalières en facilitant la gestion en temps réel des sorties. Les modèles développés dans cette étude ont atteint de bonnes performances dans la prédiction des événements de sortie et ont montré l'importance de caractéristiques spécifiques liées aux soins des patients.

Ces avancées pourraient mener à des bénéfices en matière de gestion du flux des patients et d'allocation des ressources, résultant finalement en une meilleure prestation de soins de santé. Bien que l'étude se soit concentrée sur un groupe d'hôpitaux spécifique, les résultats suggèrent une applicabilité plus large de ces modèles pour soutenir les efforts de gestion hospitalière dans divers contextes.

Source originale

Titre: Improving patient flow through hospitals with machine learning based discharge prediction

Résumé: Accurate predictions of hospital discharge events could help improve patient flow through hospitals and the efficiency of care delivery. However, the potential of integrating machine learning with diverse electronic health records (EHR) data for this task has not been fully explored. We used EHR data from 01 February 2017 to 31 January 2020 in Oxfordshire, UK to predict hospital discharges in the next 24 hours. We fitted separate extreme gradient boosting models for elective and emergency admissions, trained using the first two years of data and tested using the final year of data. We examined individual-level and hospital-level model performance and evaluated the impact of training data size and recency, prediction time of day, and performance in different subgroups. Our individual patient level models for elective and emergency admissions achieved AUCs of 0.87 and 0.86, AUPRCs of 0.66 and 0.64 and F1 scores of 0.61 and 0.59, respectively, substantially better than a baseline logistic regression model. Aggregating individual probabilities, the total daily number of hospital discharges could also be accurately estimated, with mean absolute errors of 8.9% (elective admissions) and 4.9% (emergency admissions). The most informative predictors included antibiotic prescriptions, other medications, and hospital capacity factors. Performance was generally robust across patient subgroups and different training strategies, but lower in patients with longer lengths of stay and those who eventually died in hospital. Our findings highlight the potential of machine learning in optimising hospital patient flow and facilitating patient care and recovery.

Auteurs: David W Eyre, J. Wei, J. Zhou, Z. Zhang, K. Yuan, Q. Gu, A. Luk, A. J. Brent, D. A. Clifton, A. S. Walker

Dernière mise à jour: 2024-06-04 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2023.05.02.23289403

Source PDF: https://www.medrxiv.org/content/10.1101/2023.05.02.23289403.full.pdf

Licence: https://creativecommons.org/licenses/by-nc/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires