Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 医療システムと質向上

健康研究における統計報告の改善

この研究は、健康研究における線形回帰の仮定の報告について調べてるよ。

― 1 分で読む


健康研究における統計報告健康研究における統計報告研究での回帰仮定についての批判的な視点。
目次

医療研究は、研究者がすでに調査されたことを確認し、さらに広げることができるかに依存してるんだ。毎年、新しい発見が発表されて、さまざまな病気の新しい治療法を生み出したり、公共政策を導いたりしてる。こうしたプロセスの重要な部分は、研究をピアレビューされたジャーナルに発表すること。出版プロセスでは新しい治療法が効果的で適切であることを保証するために厳しい方法が求められるんだ。加えて、研究の実践を評価・改善することは、欠陥のある研究を特定し、研究結果が信頼できることを保証するために非常に重要。

メタリサーチの重要性

メタリサーチは、研究報告の方法や正確性のチェック、改善に関する成長中の分野なんだ。研究プロセスにおけるバイアスを強調するのに役立つ。研究評価は昔からあったけど、分野がバラバラで互いに得た教訓を共有していなかったんだ。メタリサーチは、方法、報告、再現性、評価、インセンティブという5つの主要なトピックを特定してる。このフレームワークは、統計的方法を評価するのに役立ち、研究者が研究結果の全体的な質と信頼性を判断できるようにする。

統計的方法の役割

統計モデルは健康システムを理解するための重要なツールなんだ。データの変動を見たり、新しい治療法の効果を見積もったり、病気の経路についての洞察を得るのに役立つ。ただ、統計的方法の不適切な使用は誤解を招く結果につながることもある。これがリソースの無駄遣いにつながったり、患者が効果のない治療を受けたり、さらには危害を加えたりすることもあるんだ。信頼できる統計テストには、特定の基本的な前提が満たされている必要がある。もしこれらの前提が無視されると、結果が不正確になることがある。最悪の場合、これが発見を無効にして、研究者が誤った結論に達する原因になる。

重要でありながら、こうした統計の前提についての議論が公開研究からしばしば欠けている。多くの研究が重要な前提を言及しないという研究結果もある。統計の不適切な実践や報告はさまざまな分野に広がっている。統計学者は、研究と実用的な応用の間にギャップがあることを観察していて、研究者はしばしば十分な専門知識なしで統計的方法を使用しなければならない。

統計の偉人の一人であるロナルド・フィッシャーは、1925年に発表した本で研究者に統計をよりアクセスしやすくしたんだ。でも、将来、ユーザーが深い技術的知識なしに結果を出せる統計ソフトウェアが登場することを予測するのは難しかっただろう。

強力な統計知識の必要性

利用可能なデータの増加と統計分析の依存度が高まる中で、研究者は統計的方法をしっかり理解する必要がある。でも、多くの研究者は統計についての基礎的なトレーニングしか受けていなくて、統計学者へのアクセスも限られている。このため、正確に統計的方法を適用する能力が制限されてしまう。この記事では、これらの課題や誤解を、一つの一般的な統計手法である線形回帰とその前提に焦点を当てて探るつもり。目的は、研究と実践の間のギャップをよりよく理解し、トレーニングや報告基準の改善に対する提言を提供すること。

研究質問

  • どれだけの著者チームが原稿で線形回帰の前提をチェックしたことを示しているか?
  • 著者チームはこれらの前提を正しくチェックしているか?
  • 異なる統計学者による統計的前提の評価にはどれほどの一致があるか?

研究概要

主な目的は、著者が現在どのように線形回帰を公開作品の中で報告しているか、特にその前提に焦点を当てること。以前の研究では、これらの前提の報告が非常に低いことが示されていた。この研究は、線形回帰に言及する論文のランダムな選択における前提の議論の有病率を推定することを目指している。

サンプルサイズ

この研究では、特定の統計的信頼区間を使用して5%の有病率を検出するために、100 Papersのサンプルサイズが適切と考えられた。以前のフェーズでの経験に基づいて、約40人の統計学者を募集してこれらの論文をレビューすることにした。各統計学者は5つの論文をレビューすることになり、徹底的なフィードバックを提供するのに管理可能な数となった。その後、各論文は2人の独立した統計学者によって2回評価され、調査結果を強化し、統計学者間の一致を確認した。

質問の発展

線形回帰分析がどのように報告されているかを評価するための一連の質問が作成された。この質問は文献の既存のガイドラインに基づいている。統計の質を評価するために包括的な質問リストが開発された。ただし、レビュアーが理解しやすくするために質問の数が減らされた。研究チームは質問の表現を洗練させて明確さを確保した。その後、少数の独立した専門家に質問の読みやすさと適切さをレビューしてもらい、30の質問からなるチェックリストを作成した。

論文の選択

線形回帰」という用語をメソッドセクションで使用している論文が特定のジャーナルの2019年の号から選ばれた。ランダムな順序に基づいて、最初の100の対象論文のみが選ばれた。含まれた論文と除外された論文の完全なリストが透明性を保つために保持された。

包括基準

  1. 論文がメソッドセクションで「線形回帰」に言及している。
  2. 論文が特定の時間枠内で発表された。
  3. 論文が健康関連のトピックに焦点を当てている。
  4. 論文が研究論文として分類されている。

除外基準

  1. より複雑なタイプの線形回帰を使用した研究。
  2. ノンパラメトリック線形回帰や他の代替方法。
  3. 線形回帰を主要な分析として焦点を当てていない論文。

主研究者は、100の論文が包含基準を満たすまで一つずつレビューを行った。実際に線形回帰の結果を持たない論文も除外された。

論文のランダム割り当て

論文は統計学者にランダムに割り当てられて、その作業を評価された。各統計学者には5つの論文が与えられた。このアプローチは、一つの統計学者が同じ論文を一度以上扱わないことを確保するのに役立った。

参加した統計学者

研究は、さまざまなバックグラウンドを持つ資格のある統計学者を含むことを目指している。統計学者はターゲットを絞ったメールとソーシャルメディアプラットフォームを通じて募集された。参加登録後、彼らはレビューするためのすべての必要な資料と論文へのアクセスを受け取った。

倫理と同意

この研究は地元の委員会から倫理的承認を受けた。統計学者は研究に参加する前に、インフォームドコンセントを提供する必要があった。

データ分析計画

この確認研究は、著者が健康および生物医学研究論文において線形回帰の前提をどのように報告しているかを調査する。報告行動を説明するために頻度とパーセンテージが使用され、評価者間の一致が統計的に定量化される。

線形回帰の理解

この研究は線形回帰の詳細なチュートリアルとしての目的ではなく、統計的知識があまりない人にもアクセスしやすい基本的な概要を提供する。線形回帰は、一つの従属変数と一つ以上の独立変数の間の関係を説明することを目的としている。

単純な線形回帰モデルをフィットさせるとき、独立変数の変化が従属変数にどのように影響するかについての予測が行われる。たとえば、体重は年齢とともにどのように変化するのか?

線形回帰の主要な前提

  1. 正規性: 残差は正規分布しているべき。
  2. 線形性: 変数間の関係は線形であるべき。
  3. 均一性: 残差の分散は一定であるべき。
  4. 独立性: 観察値同士は互いに影響を与えないべき。

これらの前提をチェックしないと、結果が正確でない可能性があり、研究者は誤った結論を引き出すことになる。

研究の発見

評価された95本の論文のうち、大多数が線形回帰の前提をチェックしたと報告していなかった。少数の論文が1つまたは2つの前提を確認したと述べたが、全ての4つの前提をチェックしたと明示的に報告した著者はいなかった。具体的には、残差の正規性をチェックした著者はごくわずかで、さらにその中でも正確に行ったのは数人だった。

報告の傾向

著者はしばしば正規性のチェックを報告したが、回帰分析に関連する前提をどのように調べたかの詳細に欠けていた。多くの研究が論文内で残差に言及すらしていなかった。線形性については、一部の論文が図を表示していたが、それを前提のチェックに関連づけて議論したものは少なかった。

ほとんどの論文が均一性や独立性について言及しなかった。統計的レビュアー間の一致は高精度だったものの、独立性のような特定の領域では一致が低く、誤解があることを示唆している。

統計理解における誤解

この研究は、線形回帰の前提に関するいくつかの一般的な誤解を明らかにした。多くの研究者がデータのニュアンスを理解せずに基本的な正規性のチェックに依存している。特に健康や生物医学の分野の研究者において、統計リテラシーの向上が必要だ。

改善のための提言

研究と実践のギャップを埋めるために、いくつかの提言ができる:

  1. トレーニング: 統計的方法や前提についての適切なトレーニングを重視することが重要。コースには、さまざまな方法がどのように関連し合うかの実践的な応用を含めるべきだ。

  2. 統計レビュー: ジャーナルは、出版プロセスの一環として統計レビューを奨励し、方法論の質と正確さを確保するべきだ。

  3. 明確な報告: 著者は、統計的前提をどのようにチェックしたかについての明確な詳細を提供し、理想的にはこの情報を補足資料に含めるよう努めるべきだ。

  4. リソース: 研究者が統計的方法や前提を理解するのを助けるためのアクセスしやすいリソースを提供することで、より良い実践が育まれるだろう。

  5. ツール: 統計チェックや報告を助ける自動化ツールを探ることで、透明性と正確さが向上するかもしれない。

結論

この研究の結果は、特に健康や生物医学の分野における研究論文での線形回帰の報告の現状を明らかにしている。前提の議論が低い普及率や研究者間に存在する誤解を考慮すると、より良いトレーニングと支援が明らかに必要だ。これらのギャップに対処することで、研究の質が向上し、公共の健康政策や治療のためのより信頼性のある結果につながるだろう。

補足情報

  • 詳細な分析と結果を示す表は補足資料で確認できるよ。
オリジナルソース

タイトル: Common misconceptions held by health researchers when interpreting linear regression assumptions, a cross-sectional study

概要: BackgroundStatistical models are powerful tools that can be used to understand complex relationships in health systems. Statistical assumptions are a part of a framework for understanding analysed data, enabling valid inferences and conclusions. When poorly analysed, studies can result in misleading conclusions, which, in turn, may lead to ineffective or even harmful treatments and poorer health outcomes. This study examines researchers understanding of the commonly used statistical model of linear regression. It examines understanding around assumptions, identifies common misconceptions, and recommends improvements to practice. MethodsOne hundred papers were randomly sampled from the journal PLOS ONE, which used linear regression in the materials and methods section and were from the health and biomedical field in 2019. Two independent volunteer statisticians rated each paper for the reporting of linear regression assumptions. The prevalence of assumptions reported by authors was described using frequencies, percentages, and 95% confidence intervals. The agreement of statistical raters was assessed using Gwets statistic. ResultsOf the 95 papers that met the inclusion and exclusion criteria, only 37% reported checking any linear regression assumptions, 22% reported checking one assumption, and no authors checked all assumptions. The biggest misconception was that the Y variable should be checked for normality, with only 5 of the 28 papers correctly checking the residuals for normality. ConclusionThe prevalence of reporting linear regression assumptions remains low. When reported, they were often incorrectly checked, with very few authors showing any detail of their checks. To improve reporting of linear regression, a significant change in practice needs to occur across multiple levels of research, from teaching to journal reviewing. The focus should be on understanding results where the underlying statistical theory is viewed through the lens of "everything is a regression" rather than deploying rote-learned statistics.

著者: Lee Jones, A. Barnett, D. Vagenas

最終更新: 2024-02-20 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2024.02.15.24302870

ソースPDF: https://www.medrxiv.org/content/10.1101/2024.02.15.24302870.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事