Simple Science

La science de pointe expliquée simplement

# Sciences de la santé# Neurologie

Prédire le risque de TVE après un AVC ischémique aigu

Nouveau modèle améliore la prédiction du risque de TVE chez les patients ayant subi un AVC.

― 9 min lire


Modèle de prédiction VTEModèle de prédiction VTEpour les patients ayantsubi un AVCdu risque de TVE après un AVC.Un nouveau modèle améliore l'évaluation
Table des matières

L'AVC, c'est un gros problème de santé dans le monde entier. C'est la deuxième cause de décès, avec environ 6,1 millions de morts chaque année. C'est aussi une des principales causes de handicap à long terme. Parmi les différents types d'AVC, les AVC ischémiques aigus (AIA) sont les plus courants. Un des soucis graves qui peut arriver après un AVC ischémique, c'est l'embolie thrombo-phonique veineuse (ETPV). C'est une condition dangereuse qui survient souvent dans les deux semaines suivant un AVC, surtout dans la première semaine. Avoir une ETPV augmente le risque de mourir dans les trois mois après un AVC, donc c'est un point crucial pour les soins de santé après un AVC.

La Complexité de la Prédiction des Risques d'ETPV

Prédire le risque d'ETPV chez les patients ayant eu un AVC ischémique aigu, c'est pas simple. Les outils d'évaluation des risques actuels, comme le système de score Caprini et le Padua Prediction Score, ne prennent pas en compte tout un tas de facteurs de risque pour ces patients. Ils omettent souvent des détails importants, comme les données démographiques des patients, les conditions médicales spécifiques et les antécédents de santé. Comme les survivants d'AVC peuvent être très différents les uns des autres, prédire le risque d'ETPV de manière précise nécessite de considérer plein de facteurs comme l'âge, le sexe, les médicaments et des problèmes de santé chroniques comme l'hypertension et le diabète.

Pour relever ces défis, de nouvelles recherches ont mis au point un modèle de machine learning pour prédire le risque d'ETPV chez les personnes ayant eu un AVC ischémique aigu. Ce modèle va au-delà des outils d'évaluation traditionnels en prenant en compte un large éventail de facteurs, des traits personnels aux données cliniques détaillées. L'objectif est non seulement d'augmenter la précision des prédictions, mais aussi d'aider les professionnels de santé à comprendre l'importance des différents facteurs de risque pour chaque patient.

Manque de Recherche Avancée

Il y a pas beaucoup d'études qui ont utilisé des techniques avancées de machine learning pour prédire l'ETPV après un AVC ischémique aigu. Il y a un vide dans la recherche quand il s'agit de créer des modèles de machine learning qui peuvent prédire l'ETPV de manière précise tout en respectant des directives strictes sur la qualité des modèles prédictifs. Cette étude vise à combler ce vide en collectant et en traitant les données avec soin et en appliquant des méthodes solides de machine learning. En construisant un modèle clair et fiable, la recherche espère aider les médecins à identifier les patients à risque plus élevé d'ETPV après un AVC, permettant ainsi de meilleures stratégies de prévention.

Population de l'Étude

Les données pour cette étude viennent de la plateforme du Système de Maladies Neurologiques de Shenzhen, qui collecte des informations sur les patients ayant subi un AVC ischémique depuis 2021. Ces données incluent plein de détails, comme des informations démographiques, des antécédents médicaux, des diagnostics, des traitements et des résultats de laboratoire en provenance de 20 hôpitaux. L'étude s'est concentrée sur les patients admis pour un AVC entre décembre 2021 et décembre 2023, qui ont été diagnostiqués par IRM ou angiographie CT, âgés de 18 ans ou plus, et hospitalisés dans la semaine suivant l'apparition des symptômes. Les patients ayant certaines conditions comme des attaques ischémiques transitoires ou des antécédents de problèmes de coagulation ont été exclus. Les chercheurs ont collecté des données en deux parties pour le développement et la validation du modèle.

Variables Prédictives et Résultats

L'objectif principal de cette étude était de créer un modèle qui évalue précisément la probabilité de développer une ETPV après un AVC ischémique aigu. Le modèle s'appuie sur des données complètes provenant d'un large éventail de patients AIA. Les facteurs prédictifs sélectionnés étaient ceux enregistrés dans les trois premiers jours suivant l'admission à l'hôpital, y compris le sexe, l'âge, la taille, le poids, les habitudes de vie comme le tabagisme et l'alcool, et diverses conditions de santé.

Tous les diagnostics d'ETPV ont été confirmés par des techniques d'imagerie spécifiques, assurant que les résultats étaient fiables. Les patients présentant des signes potentiels d’ETPV durant leur séjour à l’hôpital ont été soigneusement examinés et évalués.

Traitement des données et Sélection des Caractéristiques

Pour améliorer la précision prédictive du modèle pour le risque d'ETPV, des techniques avancées ont été appliquées, comme l'algorithme des K-plus proches voisins (KNN) et la technique de suréchantillonnage SMOTE. Cette stratégie soignée a amélioré la fiabilité du modèle. Le KNN a été utilisé pour estimer les points de données manquants en regardant des cas similaires dans l'ensemble de données. Cette méthode a aidé à maintenir la richesse des données cliniques sans avoir besoin de collectes de données invasives. Les déséquilibres de données, où certains résultats étaient beaucoup plus rares que d'autres, ont été traités avec SMOTE, ce qui a conduit à une représentation plus équitable de tous les cas dans le modèle.

Développement du Modèle et Évaluation de la Performance

Pour développer un modèle prédictif efficace du risque d'ETPV, la recherche a utilisé deux techniques principales pour sélectionner les facteurs importants : la régression logistique en étapes et l'opérateur de sélection et de rétrécissement absolu le plus petit (LASSO). Ces méthodes ont aidé à identifier les facteurs fortement associés au risque d'ETPV tout en réduisant le risque que le modèle soit trop compliqué ou surajusté. L'efficacité du modèle a été testée par un processus appelé validation croisée à dix volets, qui garantit que chaque segment de données est utilisé à la fois pour l'entraînement et le test, fournissant une évaluation plus fiable.

Une variété d'algorithmes de machine learning a été testée, y compris la régression logistique, le naïf Bayes, les arbres de décision, la forêt aléatoire, les machines à gradient boosting, le boosting de gradient extrême et les machines à vecteurs de support. Chaque algorithme offrait des forces différentes, permettant une analyse approfondie des données.

Analyse Statistique

L'ensemble de données a subi une analyse statistique approfondie. Différents tests ont été utilisés pour évaluer les relations entre divers facteurs et l'occurrence de l'ETPV. Les variables qui montraient des relations significatives ont été sélectionnées pour des analyses plus poussées. Des techniques de visualisation ont aidé à afficher les résultats de l'échantillonnage et la performance du modèle.

Approbation Éthique et Consentement

Cette recherche a été approuvée par un comité d'examen éthique, garantissant que les données des patients étaient collectées et utilisées de manière éthique. Les patients ou leurs représentants devaient donner leur consentement pour que leurs données soient incluses dans l'étude.

Caractéristiques de la Population de l'Étude

L'étude a inclus 1 632 participants, avec un taux d'ETPV de 4,17 %. L'âge moyen des patients avec ETPV était de 69 ans, nettement plus vieux que ceux sans ETPV. Les caractéristiques démographiques et cliniques de la population ont été détaillées.

Corrélation des Variables avec le Résultat Clinique

L'analyse univariée a trouvé des corrélations significatives entre l'occurrence de l'ETPV et plusieurs facteurs, y compris le sexe, l'âge, la taille, les habitudes de vie et diverses conditions médicales. Cette comparaison détaillée a fourni des insights sur les facteurs essentiels pour comprendre le risque d'ETPV.

Ingénierie des Caractéristiques

La visualisation des données originales a montré que l'ensemble de données avait un résultat déséquilibré, ce qui a été traité par des techniques comme le sous-échantillonnage aléatoire et le suréchantillonnage. Ce processus a rendu l'ensemble de données plus équilibré, permettant de créer un meilleur modèle prédictif.

Interprétation du Modèle et Analyse SHAP

Assurer que les modèles prédictifs sont faciles à comprendre est important pour qu'ils soient acceptés par les professionnels de santé. L'analyse SHAP (SHapley Additive exPlanations) a été utilisée pour clarifier comment différents facteurs affectent les prédictions du modèle. Cette analyse a fourni des informations sur les variables les plus importantes dans la prédiction du risque d'ETPV.

Implications Prognostiques

Le modèle de Gradient Boosting Machine a été intégré dans une application web pour aider à prédire le risque d'ETPV chez les patients AIA. Cet outil permet aux cliniciens d'entrer les informations du patient et d'obtenir des évaluations de risque en temps réel.

Conclusion

L'étude a réussi à développer des modèles de machine learning pour prédire le risque d'ETPV chez les patients ayant subi un AVC ischémique aigu. Les modèles ont pris en compte un large éventail de facteurs, offrant une approche complète pour l'évaluation du risque. En se concentrant à la fois sur la précision et l'interprétabilité, cette recherche met en lumière le potentiel du machine learning pour améliorer la prise de décision clinique et les soins aux patients dans la gestion du risque d'ETPV après un AVC. Les résultats soulignent l'importance de comprendre les facteurs individuels des patients pour mieux aborder le risque, ce qui conduit à des interventions sur mesure et de meilleurs résultats.

Source originale

Titre: Leveraging Machine Learning for Enhanced and Interpretable Risk Prediction of Venous Thromboembolism in Acute Ischemic Stroke Care

Résumé: BackgroundStroke is the second leading cause of death globally, with acute ischemic strokes constituting the majority. Venous thromboembolism (VTE) poses a significant risk during the acute phase post-stroke, and early recognition is critical for preventive intervention of VTE. MethodsUtilizing data from the Shenzhen Neurological Disease System Platform to develop multiple machine learning models that included variables such as demographics, clinical data, and laboratory results. Advanced technologies such as K nearest neighbor and synthetic minority oversampling technique are used for data preprocessing, and algorithms such as gradient boosting machine and support vector machine are used for model development.Feature analysis of optimal models using SHapley Additive exPlanations interpretable algorithm. ResultsIn our study of 1,632 participants, in which women were more prevalent, the median age of patients with VTE was significantly older than that of non-VTE individuals. Data analysis showed that key predictors such as age, alcohol consumption, and specific medical conditions were significantly associated with VTE outcomes. The AUC of all prediction models is above 0.7, and the GBM model shows the highest prediction accuracy with an AUC of 0.923. These results validate the effectiveness of this model in identifying high-risk patients and demonstrate its potential for clinical application in post-stroke VTE risk management. ConclusionThis study presents an innovative, machine learning-based approach to predict VTE risk in acute ischemic stroke patients, offering a tool for personalized patient care. Future research could explore integration into clinical decision systems for broader application.

Auteurs: Youli Jiang, A. Li, Z. Li, Y. Li, R. Li, Q. Zhao, G. Li

Dernière mise à jour: 2024-04-13 00:00:00

Langue: English

Source URL: https://www.medrxiv.org/content/10.1101/2024.04.11.24305689

Source PDF: https://www.medrxiv.org/content/10.1101/2024.04.11.24305689.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires

Vision par ordinateur et reconnaissance des formesAvancées dans la classification de la dominance cardiaque avec l'apprentissage automatique

L'apprentissage automatique améliore les évaluations des problèmes cardiaques grâce à une classification précise de la dominance cardiaque.

― 6 min lire