Améliorer le reporting statistique dans la recherche en santé
Cette étude examine la façon dont on rapporte les hypothèses de régression linéaire dans la recherche en santé.
― 11 min lire
Table des matières
- Importance de la Méta-Recherche
- Le Rôle des Méthodes Statistiques
- Le Besoin d'une Solide Connaissance Statistique
- Questions de Recherche
- Aperçu de l'Étude
- Taille de l'Échantillon
- Développement des Questions
- Sélection des Articles
- Allocation Aléatoire des Articles
- Statisticiens Impliqués
- Éthique et Consentement
- Plan d'Analyse des Données
- Compréhension de la Régression Linéaire
- Hypothèses Clés de la Régression Linéaire
- Résultats de l'Étude
- Tendances dans le Rapport
- Malentendus dans la Compréhension Statistique
- Recommandations pour l'Amélioration
- Conclusion
- Informations Complémentaires
- Source originale
La recherche médicale dépend des chercheurs pour pouvoir confirmer et approfondir ce qui a déjà été étudié. Chaque année, de nouvelles découvertes sont publiées, aidant à créer de nouveaux traitements pour diverses maladies et à orienter les politiques publiques. Une partie essentielle de ce processus est le partage de la recherche par la publication dans des revues à comité de lecture. Ce processus de publication exige des méthodes strictes pour garantir que les nouveaux traitements soient à la fois efficaces et appropriés. De plus, évaluer et améliorer les pratiques de recherche est crucial pour identifier les études erronées et s'assurer que les résultats de recherche peuvent être fiables.
Importance de la Méta-Recherche
La méta-recherche est un domaine en croissance qui examine comment la recherche est rapportée, vérifiée pour son exactitude, et améliorée. Elle aide à mettre en lumière les biais dans le processus de recherche. Bien que l'évaluation de la recherche ait toujours été présente, elle était auparavant éparpillée, avec différents domaines ne partageant pas les leçons apprises. La méta-recherche identifie cinq thèmes principaux : méthodes, reporting, reproductibilité, évaluation et incitations. Ce cadre est utile pour évaluer les méthodes statistiques, permettant ainsi aux chercheurs de juger de la qualité et de la fiabilité globales des résultats de recherche.
Le Rôle des Méthodes Statistiques
Les modèles statistiques sont des outils importants pour comprendre les systèmes de santé. Ils aident les chercheurs à examiner les variations dans les données, à estimer l'efficacité des nouveaux traitements, et à obtenir des informations sur les voies de maladies. Cependant, une mauvaise utilisation des méthodes statistiques peut conduire à des résultats trompeurs. Cela peut gaspiller des ressources et même entraîner des traitements qui n'aident pas ou nuisent aux patients. Pour que les tests statistiques soient fiables, certaines hypothèses de base doivent être respectées. Si ces hypothèses ne le sont pas, les résultats pourraient être inexacts. Dans le pire des cas, cela peut invalider les conclusions, amenant les chercheurs à tirer des conclusions incorrectes.
Malgré son importance, les discussions sur ces hypothèses statistiques font souvent défaut dans les études publiées. Des recherches indiquent que de nombreuses études négligent de mentionner des hypothèses clés. De mauvaises pratiques et un rapport biaisé des statistiques sont répandus dans divers domaines. Les statisticiens ont observé un fossé entre la recherche et l'application pratique, où les chercheurs doivent souvent utiliser des méthodes statistiques sans suffisamment d'expertise.
Un des grands noms dans le domaine des statistiques, Ronald Fisher, a rendu les statistiques plus accessibles aux chercheurs avec son livre publié en 1925. Cependant, il serait difficile de prédire comment l'avenir apporterait des logiciels statistiques permettant aux utilisateurs de produire des résultats sans avoir besoin de connaissances techniques approfondies.
Le Besoin d'une Solide Connaissance Statistique
Avec l'augmentation des données disponibles et la dépendance à l'analyse statistique, les chercheurs ont besoin d'une bonne maîtrise des méthodes statistiques. Pourtant, beaucoup de chercheurs ne reçoivent qu'une formation de base en statistiques et ont un accès limité aux statisticiens. Cela limite leur capacité à appliquer correctement les méthodes statistiques. Cet article examine ces défis et malentendus en se concentrant sur une technique statistique courante : la Régression Linéaire et ses hypothèses. L'objectif est de mieux comprendre l'écart entre la recherche et la pratique des chercheurs et de fournir des recommandations pour améliorer la formation et les normes de rapport.
Questions de Recherche
- Combien d'équipes d'auteurs montrent dans leurs manuscrits qu'elles ont vérifié les hypothèses de régression linéaire ?
- Les équipes d'auteurs vérifient-elles correctement ces hypothèses ?
- Quel est le niveau d'accord sur les évaluations des hypothèses statistiques faites par différents statisticiens ?
Aperçu de l'Étude
L'objectif principal est de voir comment les auteurs rapportent actuellement la régression linéaire dans les travaux publiés, en se concentrant spécifiquement sur ses hypothèses. Des études précédentes indiquent que le rapport de ces hypothèses est très faible. Cette étude vise à estimer la prévalence des discussions sur les hypothèses dans une sélection aléatoire d'articles qui mentionnent la régression linéaire.
Taille de l'Échantillon
Pour cette étude, une taille d'échantillon de 100 articles a été jugée adéquate pour détecter une prévalence de 5 % en utilisant un intervalle de confiance statistique spécifique. Sur la base des expériences lors des phases précédentes, il a été décidé de recruter environ 40 statisticiens pour examiner ces articles. Chaque statisticien devait examiner cinq articles, ce qui était gérable pour leur fournir des retours détaillés. Chaque article a ensuite été noté deux fois par deux statisticiens indépendants pour renforcer les résultats et vérifier l'accord entre les statisticiens.
Développement des Questions
Un ensemble de questions a été créé pour évaluer comment l'analyse de régression linéaire est rapportée. Les questions étaient basées sur des directives existantes dans la littérature. Une liste complète de questions a été développée pour évaluer la qualité statistique. Cependant, pour faciliter la tâche des évaluateurs, le nombre de questions a été réduit. L'équipe de recherche s'est assurée de peaufiner la formulation des questions pour garantir leur clarté. Suite à cela, un petit groupe d'experts indépendants a été sollicité pour examiner les questions pour leur lisibilité et leur pertinence, aboutissant à une liste de contrôle de 30 questions.
Sélection des Articles
Les articles qui utilisaient le terme "régression linéaire" dans leur section méthodes ont été sélectionnés dans les numéros 2019 d'une revue spécifique. Seuls les 100 premiers articles éligibles ont été choisis selon un ordre aléatoire. Une liste complète des articles inclus et exclus a été conservée pour la transparence.
Critères d'Inclusion
- Les articles mentionnaient "régression linéaire" dans la section méthodes.
- Les articles ont été publiés dans un délai spécifique.
- Les articles se concentraient sur des sujets liés à la santé.
- Les articles étaient classés comme articles de recherche.
Critères d'Exclusion
- Études ayant utilisé des types de régression linéaire plus complexes.
- Régression linéaire non paramétrique ou autres méthodes alternatives.
- Articles qui ne se concentraient pas sur la régression linéaire comme analyse principale.
Le chercheur principal a examiné les articles un par un jusqu'à ce que 100 répondent aux critères d'inclusion. Tout article qui n'avait pas réellement de résultats de régression linéaire a également été exclu.
Allocation Aléatoire des Articles
Les articles ont été attribués aléatoirement aux statisticiens pour évaluer leur travail. Chaque statisticien a reçu cinq articles à examiner. Cette approche a permis de s'assurer qu'aucun statisticien ne s'occupait du même article plus d'une fois.
Statisticiens Impliqués
L'étude visait à inclure des statisticiens qualifiés, venant de divers horizons. Les statisticiens ont été recrutés par le biais d'e-mails ciblés et de plateformes de réseaux sociaux. Après leur inscription, ils ont reçu tous les matériaux nécessaires et l'accès aux articles qu'ils devaient examiner.
Éthique et Consentement
L'étude a reçu l'approbation éthique d'un comité local. Les statisticiens devaient fournir leur consentement éclairé avant de participer à l'étude.
Plan d'Analyse des Données
Cette étude de confirmation examine comment les auteurs rapportent les hypothèses de régression linéaire dans les articles de recherche en santé et biomédicale. Des fréquences et des pourcentages seront utilisés pour décrire les comportements de rapport, tandis que l'accord entre les évaluateurs sera quantifié statistiquement.
Compréhension de la Régression Linéaire
Bien que cette étude ne soit pas destinée à servir de tutoriel détaillé sur la régression linéaire, elle fournit un aperçu de base accessible à ceux qui ont peu de connaissances statistiques. La régression linéaire vise à expliquer les relations entre une variable dépendante et une ou plusieurs variables indépendantes.
En ajustant un modèle de régression linéaire simple, des prédictions sont faites sur comment les changements dans une variable indépendante impactent la variable dépendante. Par exemple, comment le poids corporel change-t-il au fur et à mesure qu'une personne vieillit ?
Hypothèses Clés de la Régression Linéaire
- Normalité : Les résidus doivent être normalement distribués.
- Linéarité : La relation entre les variables doit être linéaire.
- Homoscedasticité : La variance des résidus doit rester constante.
- Indépendance : Les observations ne doivent pas s'influencer les unes les autres.
Si ces hypothèses ne sont pas vérifiées, les résultats peuvent ne pas être exacts, conduisant les chercheurs à tirer des conclusions incorrectes.
Résultats de l'Étude
Sur les 95 articles notés, une majorité significative n'a pas rapporté avoir vérifié aucune des hypothèses de régression linéaire. Une plus petite proportion a mentionné avoir vérifié une ou deux hypothèses, tandis qu'aucun auteur n'a explicitement déclaré avoir vérifié les quatre hypothèses. Plus précisément, seule une fraction des auteurs a vérifié la normalité des résidus, et parmi ceux-là, seulement quelques-uns l'ont fait correctement.
Tendances dans le Rapport
Les auteurs ont souvent rapporté avoir vérifié la normalité mais ont échoué à détailler comment ils ont examiné les hypothèses liées à leur analyse de régression. De nombreuses études n'ont même pas mentionné les résidus dans leur discussion. En ce qui concerne la linéarité, une partie des articles montrait des figures, mais peu en discutaient par rapport à la vérification de l'hypothèse.
La plupart des articles n'ont pas mentionné l'homoscedasticité ou l'indépendance. L'accord entre les évaluateurs statistiques a montré une grande précision dans leurs évaluations, bien que certains domaines, comme l'indépendance, aient montré un accord plus faible, indiquant une certaine incompréhension.
Malentendus dans la Compréhension Statistique
Cette étude a mis en lumière plusieurs malentendus courants concernant les hypothèses de régression linéaire. De nombreux chercheurs s'appuient fortement sur des contrôles basiques pour la normalité sans comprendre les nuances de leurs données. Il y a un besoin d'améliorer la culture statistique parmi les chercheurs, en particulier ceux dans les domaines de la santé et biomédicale.
Recommandations pour l'Amélioration
Pour combler le fossé entre la recherche et la pratique, plusieurs recommandations peuvent être formulées :
Formation : Il est crucial de souligner l'importance d'une formation appropriée pour les chercheurs sur les méthodes et hypothèses statistiques. Les cours devraient inclure des applications pratiques avec un contexte plus large sur comment les différentes méthodes se relient les unes aux autres.
Révision Statistique : Les revues devraient encourager une révision statistique dans le cadre du processus de publication pour garantir la qualité et la justesse de la méthodologie.
Rapport Clair : Les auteurs devraient s'efforcer de fournir des détails clairs sur la manière dont ils ont vérifié les hypothèses statistiques, idéalement en incluant ces informations dans des matériaux supplémentaires.
Ressources : Fournir des ressources accessibles pour aider les chercheurs à comprendre les méthodes et hypothèses statistiques favorisera de meilleures pratiques.
Outils : Explorer des outils automatisés pour aider avec les vérifications et rapports statistiques pourrait améliorer la transparence et l'exactitude des rapports.
Conclusion
Les résultats de cette étude éclairent l'état actuel du rapport de régression linéaire dans les articles de recherche, en particulier dans les domaines de la santé et biomédicale. Avec la faible prévalence des discussions sur les hypothèses et les malentendus présents parmi les chercheurs, il y a un besoin clair d'une meilleure formation et d'un meilleur soutien. En abordant ces lacunes, la qualité de la recherche peut être améliorée, conduisant à des résultats plus fiables et de meilleurs résultats pour les politiques de santé publique et les traitements.
Informations Complémentaires
- Des tableaux montrant l'analyse détaillée et les résultats peuvent être trouvés dans les matériaux supplémentaires.
Titre: Common misconceptions held by health researchers when interpreting linear regression assumptions, a cross-sectional study
Résumé: BackgroundStatistical models are powerful tools that can be used to understand complex relationships in health systems. Statistical assumptions are a part of a framework for understanding analysed data, enabling valid inferences and conclusions. When poorly analysed, studies can result in misleading conclusions, which, in turn, may lead to ineffective or even harmful treatments and poorer health outcomes. This study examines researchers understanding of the commonly used statistical model of linear regression. It examines understanding around assumptions, identifies common misconceptions, and recommends improvements to practice. MethodsOne hundred papers were randomly sampled from the journal PLOS ONE, which used linear regression in the materials and methods section and were from the health and biomedical field in 2019. Two independent volunteer statisticians rated each paper for the reporting of linear regression assumptions. The prevalence of assumptions reported by authors was described using frequencies, percentages, and 95% confidence intervals. The agreement of statistical raters was assessed using Gwets statistic. ResultsOf the 95 papers that met the inclusion and exclusion criteria, only 37% reported checking any linear regression assumptions, 22% reported checking one assumption, and no authors checked all assumptions. The biggest misconception was that the Y variable should be checked for normality, with only 5 of the 28 papers correctly checking the residuals for normality. ConclusionThe prevalence of reporting linear regression assumptions remains low. When reported, they were often incorrectly checked, with very few authors showing any detail of their checks. To improve reporting of linear regression, a significant change in practice needs to occur across multiple levels of research, from teaching to journal reviewing. The focus should be on understanding results where the underlying statistical theory is viewed through the lens of "everything is a regression" rather than deploying rote-learned statistics.
Auteurs: Lee Jones, A. Barnett, D. Vagenas
Dernière mise à jour: 2024-02-20 00:00:00
Langue: English
Source URL: https://www.medrxiv.org/content/10.1101/2024.02.15.24302870
Source PDF: https://www.medrxiv.org/content/10.1101/2024.02.15.24302870.full.pdf
Licence: https://creativecommons.org/licenses/by-nc/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à medrxiv pour l'utilisation de son interopérabilité en libre accès.