Détection précoce des infections nosocomiales avec l'apprentissage automatique
Les modèles d'apprentissage automatique prédisent les infections chez les patients hospitalisés pour de meilleurs résultats.
― 8 min lire
Table des matières
Les infections à l'hôpital, aussi appelées infections associées aux soins de santé (IAS), sont un gros souci pour les patients et pour les systèmes de santé. On dit qu'environ 1 patient sur 31 à l'hôpital attrape une IAS chaque jour, et près de 99 000 personnes aux États-Unis meurent chaque année à cause de ces infections. La pandémie de COVID-19 a entraîné une augmentation des IAS, prouvant que les méthodes pour les prévenir ne sont pas infaillibles. Pour y remédier, les Centers for Disease Control and Prevention (CDC) ont mis en place des directives au cours de la dernière décennie. Ces directives visent à améliorer les pratiques cliniques et à mieux gérer les antibiotiques. Bien que des progrès aient été réalisés pour réduire les IAS, améliorer la situation des patients infectés, surtout ceux en état critique, reste difficile.
Détecter les infections tôt est crucial pour améliorer les résultats des patients et mettre en place des mesures pour prévenir la propagation des infections. Ça peut aussi aider à économiser de l'argent dans les coûts de santé. Par exemple, les patients hospitalisés pour la grippe, dont un pourcentage important attrape des infections à l'hôpital, ont de meilleurs résultats lorsqu'ils sont traités avec des antiviraux dès l'apparition des symptômes. De la même manière, donner des antibiotiques rapidement aux patients atteints de septicémie peut mener à de meilleurs résultats, surtout pour ceux sous ventilation mécanique.
Outils d'aide à la décision clinique
Au cours de la dernière décennie, des outils d'aide à la décision clinique ont gagné en attention, particulièrement ceux pour détecter les infections. Beaucoup de ces outils reposent sur des règles établies par des médecins. Quelques exemples incluent le système d'alerte de l'Insuffisance Rénale Aiguë (IRA) utilisé dans les hôpitaux du Pays de Galles et le National Early Warning Score (NEWS) au Royaume-Uni pour repérer les problèmes cliniques généraux. Bien que ces outils profitent de l'expérience des cliniciens, ils manquent souvent de la capacité à s'adapter aux besoins spécifiques des patients et peuvent ne pas bien capturer les cas complexes. Récemment, des études ont exploré l'utilisation des données pour créer des outils de prédiction pour évaluer le risque d'infections et de septicémie.
Vue d'Ensemble de l'Étude
Cette étude se concentre sur l'utilisation de l'apprentissage automatique avec de grandes quantités de données provenant des hôpitaux pour créer un outil de détection précoce des infections chez les patients. En combinant des données sur les caractéristiques démographiques des patients et un large éventail de signes vitaux et de résultats de tests de laboratoire, les chercheurs visent à développer un modèle capable de prédire les infections avant qu'elles ne soient cliniquement suspectées. Le meilleur modèle peut atteindre un niveau de précision élevé juste une heure avant l'apparition de signes cliniques d'infection, et il fonctionne encore bien pendant une période de 48 heures avant la suspicion clinique. Ce modèle montre également que même avec un nombre réduit de signes vitaux et de résultats de laboratoire les plus couramment mesurés, il maintient un bon niveau de précision.
Collecte de données
L'étude a utilisé des données cliniques de trois grandes bases de données hospitalières : MIMIC-III, eICU et Banner Health. Ensemble, ces ensembles de données contiennent plus de 6,5 millions de visites de patients provenant de plus de 450 hôpitaux. L'approbation éthique pour utiliser ces données a été obtenue auprès des comités d'éthique institutionnels concernés, et le consentement des patients n'était pas nécessaire puisque le projet présentait un risque minimal et avait complètement supprimé les informations de santé protégées.
Groupes d'Infection et de Contrôle
Dans cette étude, les patients avec des infections confirmées ont été identifiés sur la base de codes de diagnostic spécifiques et de tests de laboratoire. Ceux qui ont montré des signes d'infection au moins 48 heures après leur admission ont été classés dans un groupe d'infection. Un groupe de contrôle a été créé à partir de patients n'ayant pas eu de diagnostic ou de tests de laboratoire liés à des infections. Pour équilibrer les chiffres entre les groupes de contrôle et d'infection, le groupe de contrôle a été réduit en taille. Cela a assuré que les patients infectés constituaient un pourcentage spécifique de l'ensemble des données.
Si certains hôpitaux ne disposaient pas de données de laboratoire adéquates, ces patients étaient inclus dans le groupe d'infection s'ils avaient reçu certains antibiotiques. Le moment où les antibiotiques ont été administrés a aidé à déterminer la suspicion clinique d'une infection.
Pour garantir une comparaison juste en examinant les données du groupe de contrôle, un temps d'événement synthétique a été créé. Cette méthode a permis une extraction de données cohérente qui reflétait les données d'infection.
Caractéristiques Utilisées dans l'Étude
Les caractéristiques utilisées dans l'étude comprenaient trois types de données : les caractéristiques démographiques des patients (âge, sexe, taille, poids), les signes vitaux (fréquence cardiaque, pression artérielle, température) et les résultats des tests de laboratoire (analyses de sang, panels métaboliques). Une fois les données rassemblées, elles ont subi un nettoyage et un prétraitement pour créer un ensemble de données cohérent.
Pour entraîner les modèles d'apprentissage automatique, les chercheurs ont défini une période d'une heure avant la suspicion clinique d'infection pour rassembler les dernières valeurs mesurées pour chaque patient. De plus, des tendances dans les données de signes vitaux ont été incluses pour aider à la prédiction.
Algorithmes Employés
Deux types principaux d'algorithmes ont été utilisés pour l'étude : des classificateurs linéaires, qui recherchent des modèles dans les données originales, et des méthodes d'ensemble, qui combinent plusieurs modèles pour améliorer la précision. L'accent a été mis sur le maintien des modèles interprétables pour une utilisation clinique, tout en minimisant l'utilisation des ressources pour des applications pratiques. Les algorithmes spécifiques utilisés incluaient la régression logistique pour la classification linéaire et différentes formes de méthodes de boosting, telles que le Gradient Boosting utilisant des arbres de décision.
Comme l'ensemble de données présentait un déséquilibre entre les patients infectés et ceux du contrôle, les chercheurs ont utilisé des techniques de validation croisée spéciales pour garantir un entraînement et un test équitables des modèles.
Performance du Modèle
Les modèles d'apprentissage automatique ont été évalués en fonction de leur capacité à distinguer les patients infectés des patients de contrôle. Les résultats ont indiqué que le modèle de Gradient Boosting a donné les meilleurs résultats, atteignant un niveau de précision élevé. D'autres modèles, comme la régression logistique, n'ont pas bien performé. Les chercheurs ont également comparé les modèles d'apprentissage automatique avec des outils d'évaluation clinique établis. Par exemple, des relevés de température basiques à eux seuls n'étaient pas très efficaces pour prédire des infections.
Les modèles ont montré qu'en réduisant le nombre de caractéristiques utilisées, comme en se concentrant uniquement sur les signes vitaux et les caractéristiques démographiques, la performance restait acceptable. La capacité à prédire les infections à l'avance aide à une intervention médicale rapide, ce qui peut sauver des vies.
Insights et Importance
L'étude a également examiné comment différents types d'infection affectaient la performance de détection des modèles. Les modèles ont été trouvés plus efficaces pour des infections sévères comme la septicémie et les infections sanguines. De plus, la capacité des modèles à éliminer les infections était meilleure pour les patients sans conditions chroniques que pour ceux avec.
Grâce à ce travail, les chercheurs ont trouvé que la prédiction précoce des infections acquises à l'hôpital par l'apprentissage automatique pourrait offrir des avantages significatifs. Les modèles, surtout lorsqu'ils reposent sur un bon nombre de bons points de données, pourraient identifier des infections jusqu'à 48 heures avant qu'elles ne soient suspectées par les prestataires de soins.
Conclusion
Cette étude montre que l'apprentissage automatique peut être utilisé de manière efficace pour détecter tôt les infections chez les patients hospitalisés. Les modèles peuvent fournir des informations exploitables, menant à des traitements plus rapides et à de meilleurs résultats pour les patients. En utilisant les systèmes de surveillance hospitaliers existants, ces modèles peuvent aider les praticiens de la santé à prendre des décisions éclairées. Même avec un ensemble limité de caractéristiques fréquemment mesurées, les modèles atteignent toujours de bonnes performances, rendant la détection précoce des infections plus réalisable dans les hôpitaux du monde réel.
Titre: Machine Learning-based Clinical Decision Support for Infection Risk Prediction
Résumé: BackgroundHealthcare-associated infection (HAI) remains a significant risk for hospitalized patients and a challenging burden for the healthcare system. This study presents a clinical decision support tool that can be used in clinical workflows to proactively engage secondary assessments of pre-symptomatic and at-risk infection patients, thereby enabling earlier diagnosis and treatment. MethodsThis study applies machine learning, specifically ensemble-based boosted decision trees, on large retrospective hospital datasets to develop an infection risk score that predicts infection before obvious symptoms present. We extracted a stratified machine learning dataset of 36,782 healthcare-associated infection patients. The model leveraged vital signs, laboratory measurements and demographics to predict HAI before clinical suspicion, which is defined as the order of a microbiology test or administration of antibiotics. ResultsWe find that our best performing infection risk model achieves a cross-validated AUC of 0.88 at 1-hour before clinical suspicion and maintains an AUC>0.85 for 48-hours before suspicion by aggregating information across demographics and a set of 163 vital signs and laboratory measurements. A second model trained on a reduced feature space comprising demographics and the 36 most frequently measured vital signs and laboratory measurements can still achieve an AUC of 0.86 at 1-hour before clinical suspicion. These results compare favorably against using temperature alone and clinical rules such as the quick Sequential Organ Failure Assessment (qSOFA) score. Along with the performance results, we also provide an analysis on model interpretability via feature importance rankings. ConclusionsThe predictive model aggregates information from multiple physiological parameters such as vital signs and laboratory measurements to provide a continuous risk score of infection that can be deployed in hospitals to provide advance warning of patient deterioration.
Auteurs: Bryan Conroy, T. Feng, D. Noren, C. Kulkarni, S. Mariani, C. Zhao, E. Ghosh, D. Swearingen, J. Frassica, D. Mcfarlane
Dernière mise à jour: 2023-05-09 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2023.04.27.23289212
Source PDF: https://www.medrxiv.org/content/10.1101/2023.04.27.23289212.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.