Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 医療政策

医療研究におけるデータ共有の評価

医療におけるデータ共有の現状のトレンドについてのレビュー。

― 1 分で読む


医学におけるデータ共有の問医学におけるデータ共有の問続いている。医療研究では実際のデータ共有の低い割合が
目次

研究では、データを集めたり、分析したり、整理したりすることが医療や健康を含む多くの分野の科学者にとって重要なステップなんだ。生のデータや分析コードみたいな研究材料は、他の研究者にとって価値があって、方法を改善したり、結果を確認したり、新しい質問を提起したり、既存のデータを組み合わせたり、将来の科学者を教育したりするのに役立つんだ。研究材料を共有することには、プライバシーの問題やリソースの必要性などの課題があるけど、資金提供機関や出版社からは、他の人に研究成果を提供しようとする動きがここ数年増えてきてる。例えば、アメリカ政府は、資金提供したすべての研究が自由に一般にアクセスできるようにするために、各機関にポリシーの更新を勧めてるんだ。

ポリシーが変わっていく中で、医療分野におけるデータ共有の現在の文化については、まだいくつかの重要な疑問が残ってる。今の状況はどう?時間とともにどう変わってきた?政策の努力は共有を促進する上でどれくらい効果的?研究者が共有する時、その情報はどれくらい役に立つ?多くの研究がこれらの質問に答えようとしてきたけど、ほとんどは特定のグループやデータのタイプに焦点を当てていて、全体像をつかむのが難しいんだ。この記事は、医療におけるデータや分析コードの共有頻度についての既存の研究をまとめ、研究者が共有ポリシーをどれくらい守っているかを評価し、共有に影響を与える要因を特定することを目的としてる。

プロトコルと登録

私たちは、2021年5月28日に公共プラットフォーム上でレビュー計画を文書化した後、研究検索を始めた。医学研究記事におけるデータやコードの共有を検討する研究は、このレビューの対象となった。研究が発表された場所やフォーマットの種類に制限はなかった。私たちは、記事のテキストを調べた研究を含め、共有を評価するためにどんな方法でも使っている研究を入れた。医療や健康以外の研究に焦点を当てた研究や、ジャーナル記事を含まない研究は除外された。

情報源と検索戦略

2021年7月1日に、医学文献やプレプリントアーカイブなど、いくつかのデータベースを検索して関連研究を探した。他のオンラインリソースでも追加の研究を確認した。言語による制限を設けず、関連データの幅広い範囲を集めることを目指した。

研究選定

特定されたすべての研究は、重複を排除するために体系的レビューソフトウェアで整理した。タイトル、要約、全文をスクリーニングして適格性を確認し、必要に応じて議論や第三者の著者を通じて意見の不一致を解決した。各研究はデータとコードの共有に関する基準を満たす必要があった。同じデータセットに対する複数の報告が見つかった場合は、最も更新されたものを選んだ。

データ収集

適切な研究を見つけた場合、生データやDOIのような識別子が十分に共有されているかを確認した。完全なデータがない場合は、対応する著者に不足している情報を求めた。もし彼らが共有できない、またはしない場合は、代わりに要約統計を求めた。著者が応答しなかったり、設定した締切までに要求した情報を提供できなかった場合は、彼らの報告から関連データを独自に抽出した。

バイアスのリスク評価

含まれた研究には、確立された方法に基づいてバイアスのリスク評価を割り当てた。この評価では、サンプリング、報告、記事選択、および報告された推定の正確性におけるバイアスを調べた。各研究は一致した評価を保証するために複数のレビュアーによって評価された。

IPDの整合性チェックと調整

完全なデータを提供した研究については、完全性、妥当性、報告された結果を検証できるかを確認した。不一致があった場合は、著者に確認を求めた。また、分析の中で同じ記事が二重にカウントされていないかも確認した。

興味のある結果

データやコードの共有に関するいくつかの重要な結果に焦点を当てた:

  1. 著者がデータまたはコードを公開可能としていると宣言した記事の数。
  2. この公開可能性が研究者によって確認された記事の数。
  3. データやコードが要求に応じて入手可能だと宣言された記事の数。
  4. 要求に続いてデータやコードが成功裏に取得された記事の数。

これらの指標は、医療研究における実際の共有慣行に関する洞察を提供することを目的としている。

統計分析

データを分析するために、異なる研究からの要約統計を計算できる方法を使った。すべての結果について比率と信頼区間を計算した。特定の基準を満たす研究をプールして、共有率の正確な推定を保証した。

サブグループと感度分析

データの種類に応じて共有率が変わるのか、記事が強制共有ポリシーを持つ研究者からのものなのか、出版前にプレプリントとして投稿されたのかを調べる予定だった。また、出版年が共有行動に影響を与える可能性があるため、時間とともに共有率がどう変化したかも見た。

研究選定とIPD取得

私たちの検索は多くの記事を発見し、スクリーニング後にかなりの部分が除外された。最終的に、多くの一次記事を調査した適格な研究を特定した。

研究の特徴

私たちの分析に含まれる研究は、多くの医療専門分野にわたるデータの豊かなバラエティを示していた。ほとんどは評価する記事やデータの種類を制限していなかったため、データ共有の状況を包括的に理解することができた。

データとコードの共有率

私たちの分析では、2016年以降に公開された医療論文の中で、データが公開可能だと宣言されたのはほんの少しの割合に過ぎなかった。実際にデータやコードを共有したのはさらに少なかった。共有の低率は、研究者が私的に連絡を取られたときの成功率の変動とも相まって、現場の課題を強調している。

プライベートデータとコードの共有率

宣言された可用性と実際の可用性を区別すると、著者が要請に応じて共有する意欲を示したのはほんのわずかだという厳しい違いが明らかになった。データやコードを取得する際の成功率は広範囲に変動しており、研究者が共有材料にアクセスする上での課題を浮き彫りにしている。

二次的結果

共有声明や異なる共有ポリシーへの準拠に関連する追加の結果に関するデータは限られていた。それでも、特定のデータの種類やジャーナルポリシーの性質に基づく共有慣行の違いを示すいくつかの洞察が得られた。

レビューの主要な発見

私たちの広範なレビューの結果は、医療文献におけるデータ共有の宣言が増加している一方で、実際の共有は特にコードに関して頻繁ではないことを強調している。これらの発見の意義は、データ共有慣行を改善しようとする研究者や政策立案者にとって重要だ。

レビュー結果の文脈での位置付け

私たちの発見を他の科学分野と比較すると、医学における共有率は一部の分野よりは良いけど、他の分野には遅れをとっていることがわかる。プライバシーや医療規制に関連する課題が、この差に寄与している可能性が高いし、分野間のオープン性に関する文化的な違いも影響している。

我々の発見の潜在的な影響

私たちの研究は、医療分野におけるデータ共有慣行を改善するためのいくつかの道筋を示唆している。強制共有ポリシーが存在するけど、特定のデータの種類に関しては完全に効果的でないかもしれない。政策立案者は、共有率を効果的に増加させるために、インセンティブを導入したり、準拠をより厳格に監査するなどの代替戦略を検討すべきだ。

研究の強みと制限

私たちのレビューは、堅牢な方法論に基づいているため、信頼できる推定とデータの質評価を提供できる。しかし、制限としては、文献の潜在的なギャップや、データの完全性を確認したのが単一の著者だけだったため、バイアスが生じる可能性がある。

未解決の質問と将来の研究

ポリシーへの準拠やデータ共有を促進するための異なる戦略の効果に関するいくつかの重要な疑問が残っている。現在の発見は共有慣行を理解するための有用な基準を提供するけど、今後の研究は特定の分野やデータの種類をさらに深く掘り下げるべきだ。

結論

要するに、医療研究におけるデータ共有の重要性についての意識は高まっているけど、実際の慣行はまだ課題が残っている。共有データを取得する際の成功率の変動と全体的な共有率の低さは、まだやるべきことがたくさんあることを示している。医療分野における共有のユニークな課題を考慮した効果的なポリシーと戦略が、今後の改善を促進するために不可欠なんだ。

オリジナルソース

タイトル: Rates and predictors of data and code sharing in the medical and health sciences: A systematic review with meta-analysis of individual participant data.

概要: ObjectivesMany meta-research studies have investigated rates and predictors of data and code sharing in medicine. However, most of these studies have been narrow in scope and modest in size. We aimed to synthesise the findings of this body of research to provide an accurate picture of how common data and code sharing is, how this frequency has changed over time, and what factors are associated with sharing. DesignSystematic review with meta-analysis of individual participant data (IPD) from meta-research studies. Data sources: Ovid MEDLINE, Ovid Embase, MetaArXiv, medRxiv, and bioRxiv were searched from inception to July 1st, 2021. Eligibility criteriaStudies that investigated data or code sharing across a sample of scientific articles presenting original medical and health research. Data extraction and synthesisTwo authors independently screened records, assessed risk of bias, and extracted summary data from study reports. IPD were requested from authors when not publicly available. Key outcomes of interest were the prevalence of statements that declared data or code were publicly available, or available on request (declared availability), and the success rates of retrieving these products (actual availability). The associations between data and code availability and several factors (e.g., journal policy, data type, study design, research subjects) were also examined. A two-stage approach to IPD meta-analysis was performed, with proportions and risk ratios pooled using the Hartung-Knapp-Sidik-Jonkman method for random-effects meta-analysis. Three-level random-effects meta-regressions were also performed to evaluate the influence of publication year on sharing rate. Results105 meta-research studies examining 2,121,580 articles across 31 specialties were included in the review. Eligible studies examined a median of 195 primary articles (IQR: 113-475), with a median publication year of 2015 (IQR: 2012-2018). Only eight studies (8%) were classified as low risk of bias. Useable IPD were assembled for 100 studies (2,121,197 articles), of which 94 datasets passed independent reproducibility checks. Meta-analyses revealed declared and actual public data availability rates of 8% (95% CI: 5-11%, 95% PI: 0-30%, k=27, o=700,054) and 2% (95% CI: 1-3%, 95% PI: 0-11%, k=25, o=11,873) respectively since 2016. Meta-regression indicated that only declared data sharing rates have increased significantly over time. For public code sharing, both declared and actual availability rates were estimated to be less than 0.5% since 2016, and neither demonstrated any meaningful increases over time. Only 33% of authors (95% CI: 5-69%, k=3, o=429) were estimated to comply with mandatory data sharing policies of journals. ConclusionCode sharing remains persistently low across medicine and health research. In contrast, declarations of data sharing are also low, but they are increasing. However, they do not always correspond to the actual sharing of data. Mandatory data sharing policies of journals may also not be as effective as expected, and may vary in effectiveness according to data type - a finding that may be informative for policymakers when designing policies and allocating resources to audit compliance.

著者: Daniel G Hamilton, K. Hong, H. Fraser, A. Rowhani-Farid, F. Fidler, M. J. Page

最終更新: 2023-03-24 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2023.03.22.23287607

ソースPDF: https://www.medrxiv.org/content/10.1101/2023.03.22.23287607.full.pdf

ライセンス: https://creativecommons.org/licenses/by-nc/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事