L'essor des modèles de prédiction dans la santé
Examiner la croissance et les défis des modèles de prédiction dans les soins aux patients.
Lara Lusa, F. Kappenberg, G. S. Collins, M. Schmid, W. Sauerbrei, J. Rahnenfuehrer
― 10 min lire
Table des matières
- C'est Quoi Les Modèles de Prévision Clinique ?
- Les Défis d'Utiliser des Modèles de Prévision
- Le Besoin de Nouvelles Directives
- Analyser Le Paysage Actuel des Modèles de Prévision
- Sélection des Revues sur les Modèles Pronostiques
- Résultats Importants des Revues Systématiques
- Nombre d'Études et Modèles
- Données des Participants dans les Études
- Événements de Résultat Rapportés
- Prédicteurs Utilisés
- Traitement des Données Manquantes
- Mesures de Performance des Modèles
- Validation Interne et Externe
- Types de Modèles Utilisés
- Conclusion
- Source originale
- Liens de référence
Les modèles de prévision jouent un rôle clé dans le secteur de la santé en aidant les médecins à prédire les résultats des patients en fonction de divers facteurs. Ces modèles peuvent aider à diagnostiquer des conditions médicales, à prévoir la progression probable des maladies et à choisir les meilleures options de traitement pour les patients.
C'est Quoi Les Modèles de Prévision Clinique ?
Les modèles de prévision clinique utilisent des données spécifiques sur les patients pour estimer leur risque d'obtenir divers résultats de santé. Ces données peuvent inclure des détails démographiques comme l'âge et le sexe, ainsi que des antécédents médicaux et des résultats de tests.
L'intérêt pour ces modèles grandit de plus en plus dans la communauté médicale. Ces dernières années, le nombre d'études consacrées au développement de ces modèles de prévision a explosé. Par exemple, une recherche dans les bases de données médicales montre qu'il y a plus du double d'études publiées sur ce sujet par rapport à il y a vingt ans.
Les Défis d'Utiliser des Modèles de Prévision
Malgré le grand nombre d'études et l'intérêt croissant, très peu de ces modèles de prévision sont réellement utilisés dans des contextes cliniques. Plusieurs facteurs contribuent à ce problème. Un des principaux soucis est que beaucoup de ces modèles ne sont pas développés selon des directives établies. La recherche a montré que de nombreux modèles ne respectent pas les meilleures pratiques pour leur développement.
Un autre défi est la dépendance croissante à des méthodes complexes, comme l'Apprentissage automatique, pour créer ces modèles. Bien que l'apprentissage automatique puisse analyser rapidement de grands ensembles de données, ces méthodes sont souvent difficiles à comprendre et peuvent entraîner des inexactitudes si elles ne sont pas validées correctement. Le manque de transparence des résultats peut rendre difficile pour les professionnels de santé de faire confiance et d'appliquer ces modèles.
En plus, la qualité des données peut varier énormément. Beaucoup de ensembles de données n'ont pas les détails nécessaires ou l'exactitude pour fournir des informations significatives. Plusieurs problèmes courants incluent des données manquantes, des pratiques de soins différentes selon les régions, et des déséquilibres dans les démographies des patients.
Le Besoin de Nouvelles Directives
À mesure que les modèles de prévision deviennent plus complexes avec l'utilisation de techniques avancées comme l'apprentissage automatique, les recommandations traditionnelles pour le développement et le rapport de ces modèles sont souvent insuffisantes. Il y a eu des efforts pour créer de nouvelles directives spécifiquement adaptées aux modèles utilisant l'apprentissage automatique ou l'intelligence artificielle.
Ces directives visent à améliorer la conception, le rapport et l'évaluation critique des modèles de prévision. Certaines initiatives notables incluent des directives pour le développement et la validation des modèles, comment mener des essais impliquant l'intelligence artificielle, et évaluer le risque de biais dans les modèles d'apprentissage automatique.
Analyser Le Paysage Actuel des Modèles de Prévision
Pour comprendre comment le domaine de la modélisation de prévision évolue, on peut se pencher sur diverses revues systématiques qui résument les études existantes et leurs résultats. Ces revues aident à mettre en lumière les tendances dans le développement, la performance et la qualité des modèles de prévision.
Ces dernières années, le nombre de revues systématiques sur les modèles pronostiques a aussi augmenté. Bien que la plupart de ces revues se concentrent sur des maladies ou groupes de patients spécifiques, certaines englobent un éventail plus large d'études.
En analysant ces revues, il devient évident que même si plus d'études sont menées, beaucoup suivent encore des pratiques obsolètes. Bien que des améliorations aient été notées dans les méthodes de rapport et l'adhérence aux directives, des lacunes significatives demeurent.
Sélection des Revues sur les Modèles Pronostiques
Une recherche complète pour des revues systématiques a révélé une variété d'études qui portaient sur de nombreux modèles de prévision dans divers domaines médicaux. Au total, huit revues notables ont été considérées pour une analyse plus approfondie.
Ces revues couvrent des domaines divers tels que la COVID-19, l'insuffisance cardiaque, le diabète, et d'autres conditions. Elles varient dans leur approche, certaines incluant toutes les études disponibles, tandis que d'autres se concentrent spécifiquement sur des modèles utilisant des techniques modernes.
L'objectif était de mieux comprendre les caractéristiques de ces revues, y compris combien d'études elles ont examinées, les types de modèles qu'elles ont évalués, et l'éventail des résultats mesurés.
Résultats Importants des Revues Systématiques
Nombre d'Études et Modèles
Parmi les revues, il y a une tendance claire vers un nombre croissant d'études publiées axées sur la modélisation de prévision. Les années récentes ont vu une hausse significative du volume de recherches dans ce domaine.
La plupart des revues ont examiné de nombreux modèles, plusieurs études rapportant des résultats de centaines de modèles de prévision différents. Beaucoup de ces modèles sont apparus en juste quelques années récentes, mettant en avant l'intérêt croissant pour l'utilisation des prévisions en pratique clinique.
Données des Participants dans les Études
Le nombre de participants impliqués dans ces études a également augmenté au fil du temps. Les revues les plus récentes ont rapporté un nombre plus élevé de patients impliqués dans les études comparé aux années précédentes.
Cependant, bien que le nombre moyen de participants ait augmenté, la tendance réelle montre que quelques grandes études influencent considérablement ces chiffres. Cela suggère que même s'il y a plus d'études, beaucoup impliquent toujours un nombre relativement réduit de participants.
Événements de Résultat Rapportés
Les événements de résultat se réfèrent aux résultats de santé spécifiques que les modèles de prévision cherchent à prévoir. Beaucoup de revues ont indiqué que bien que le nombre d'événements de résultat rapportés augmente, des incohérences entre les études demeurent.
Cette variabilité dans le rapport peut poser des défis lorsqu'il s'agit de comparer l'efficacité des différents modèles.
Prédicteurs Utilisés
Les prédicteurs sont les différents facteurs considérés par ces modèles pour faire des prévisions. Les revues ont révélé une variation dans le nombre de prédicteurs utilisés dans les modèles. Le nombre moyen de prédicteurs candidats est resté stable au fil du temps, tandis que le nombre de prédicteurs finaux-ceux réellement utilisés dans le modèle-fluctue aussi.
Dans de nombreux cas, moins de prédicteurs finaux conduisent à des modèles plus simples, qui peuvent être plus faciles à appliquer pour les professionnels de santé.
Traitement des Données Manquantes
Plusieurs revues ont souligné que beaucoup de modèles n'ont pas rapporté comment les données manquantes étaient gérées. Ce manque de transparence soulève des inquiétudes sur la fiabilité des modèles de prévision présentés.
Les méthodes les plus courantes étaient des méthodes simples comme l'analyse de cas complets, mais la dépendance à ces méthodes n'a pas significativement diminué au fil du temps, indiquant une marge d'amélioration.
Mesures de Performance des Modèles
La Performance du Modèle est cruciale pour établir l'efficacité des modèles de prévision. Les principales mesures de performance incluent la discrimination (à quel point le modèle distingue entre différents résultats), la calibration (à quel point les résultats prévus s'alignent avec les résultats réels), et l'exactitude de classification.
Bien qu'il y ait eu une augmentation des rapports concernant les mesures de discrimination, on ne peut pas en dire autant pour les mesures de calibration et de classification. Cette incohérence rend difficile le jugement de l'efficacité globale de divers modèles.
Validation Interne et Externe
La validation est une étape cruciale pour garantir que les modèles de prévision fonctionnent bien dans divers contextes. La validation interne implique de tester le modèle sur un ensemble de données différent de celui utilisé pour sa création, tandis que la Validation Externe teste le modèle sur des données entièrement nouvelles.
Les résultats des revues indiquent que le pourcentage de modèles subissant une validation interne a augmenté au fil du temps. Cependant, la validation externe reste moins courante, avec seulement une petite proportion de modèles signalés comme validés externement. Cela souligne le besoin de meilleures pratiques dans la validation des modèles de prévision.
Types de Modèles Utilisés
Les revues ont exploré les types d'approches de modélisation utilisées dans les études de prévision. Une portion significative a utilisé des méthodes statistiques traditionnelles, tandis que d'autres ont employé des techniques d'apprentissage automatique.
Bien que les deux approches soient présentes, il n'y a pas eu de tendance marquée vers plus de modèles basés sur l'apprentissage automatique au fil du temps. De plus, bien que de nombreuses études aient rapporté l'utilisation des deux méthodes, les résultats indiquent que les méthodes statistiques restent populaires, surtout dans des domaines de recherche spécifiques.
Conclusion
Le paysage de la modélisation de prévision en santé évolue continuellement. Bien que des avancées significatives aient été réalisées, des défis persistent dans le développement, le rapport et la validation de ces modèles.
L'augmentation du nombre d'études et l'intérêt pour la modélisation prédictive est encourageant, mais des préoccupations concernant la qualité des données, le respect des directives, et la complexité des modèles demeurent.
Pour améliorer l'utilité des modèles de prévision en pratique clinique, il est essentiel de se concentrer sur la standardisation des méthodologies, l'amélioration de la transparence du rapport, et l'assurance d'une validation externe robuste. Ce faisant, la santé pourra mieux tirer parti des modèles de prévision pour fournir des soins aux patients précis et en temps opportun.
En favorisant une meilleure compréhension des tendances et des défis dans la modélisation de prévision, la communauté médicale peut travailler vers l'amélioration des résultats et l'optimisation des stratégies de traitement pour les patients à travers diverses conditions de santé.
Titre: Changes in prediction modelling in biomedicine- do systematic reviews indicate whether there is any trend towards larger data sets and machine learning methods?
Résumé: The number of prediction models proposed in the biomedical literature has been growing year on year. In the last few years there has been an increasing attention to the changes occurring in the prediction modeling landscape. It is suggested that machine learning techniques are becoming more popular to develop prediction models to exploit complex data structures, higher-dimensional predictor spaces, very large number of participants, heterogeneous subgroups, with the ability to capture higher-order interactions. We examine these changes in modelling practices by investigating a selection of systematic reviews on prediction models published in the biomedical literature. We selected systematic reviews published since 2020 which included at least 50 prediction models. Information was extracted guided by the CHARMS checklist. Time trends were explored using the models published since 2005. We identified 8 reviews, which included 1448 prediction models published in 887 papers. The average number of study participants and outcome events increased considerably between 2015 and 2019, but remained stable afterwards. The number of candidate and final predictors did not noticeably increase over the study period, with a few recent studies using very large numbers of predictors. Internal validation and reporting of discrimination measures became more common, but assessing calibration and carrying out external validation were less common. Information about missing values was not reported in about half of the papers, however the use of imputation methods increased. There was no sign of an increase in using of machine learning methods. Overall, most of the findings were heterogeneous across reviews. Our findings indicate that changes in the prediction modeling landscape in biomedicine are less dramatic than expected and that poor reporting is still common; adherence to well established best practice recommendations from the traditional biostatistics literature is still needed. For machine learning best practice recommendations are still missing, whereas such recommendations are available in the traditional biostatistics literature, but adherence is still inadequate.
Auteurs: Lara Lusa, F. Kappenberg, G. S. Collins, M. Schmid, W. Sauerbrei, J. Rahnenfuehrer
Dernière mise à jour: 2024-08-10 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.08.09.24311759
Source PDF: https://www.medrxiv.org/content/10.1101/2024.08.09.24311759.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.