試験のサンプルサイズ推定の新ツール
非遵守を考慮した臨床試験における正確なサンプルサイズ計算のためのツール。
Mohsen Soltanifar, Chel Hee Lee, Amin Shirazi, Martha Behnke, Ilfra Raymond-Loher, Getachew A. Dagne
― 1 分で読む
目次
臨床試験では、参加者の人数を決めることが超大事。この計算はサンプルサイズの推定って呼ばれてて、試験が治療効果をちゃんと検出できる力を持ってるか確認するんだ。この論文では、Rっていう人気のある統計ソフトを使って、2群の臨床試験のサンプルサイズを計算するための新しいツールについて話してるよ。目的は、参加者の非遵守やフォローアップの喪失みたいな要素を考慮しつつ、必要なサンプルサイズを見積もることなんだ。
サンプルサイズ推定の重要性
サンプルサイズの計算は、いくつかの理由から臨床試験でめっちゃ重要。まず、これによって研究が科学的に厳密で、信頼できる結果が得られることが保障される。次に、無駄に多くの参加者を勧誘することに関わる無駄なコストを避けることで資源を節約できる。そして、効果がないかもしれない治療への参加者の露出を最小限に抑えることで、彼らの権利や福祉を守ることができる。
試験を計画するとき、研究者は規制当局や医者、患者に治療のリスクと利益について明確にコミュニケーションをとる必要がある。このコミュニケーションで重要なのが「エスティマンド」を理解すること。エスティマンドは、試験が何を測ろうとしているかを示すんだ。これを正しく定義すると、参加者のドロップアウトによる欠損データの扱いを考えるのが楽になる。
臨床試験におけるサンプルサイズの計算
ランダム化された臨床試験では、サンプルサイズの計算にいくつかの重要な要素を考慮する必要がある。これには、サンプルサイズ自体、効果サイズ(治療間の期待される差)、試験の力(真の効果を検出する確率)などが含まれる。具体的には、研究者はこれらの計算に影響を与える可能性のあるさまざまなシナリオを考えることが多い。
研究者が臨床試験で使うデザインには、固定デザイン、クロスオーバーデザイン、適応デザインなどいろいろある。それぞれのデザインにはサンプルサイズの推定に必要な要件がある。この論文では、固定の2群デザインに焦点を当てるよ。
統計的背景
サンプルサイズ計算をより理解するために、関係する統計的概念を振り返る必要がある。通常、試験では4つの主要なエンドポイントタイプが考慮される:連続的な結果、二項結果、時間-イベント結果、順序カテゴリ結果。それぞれにサンプルサイズを推定するための異なる統計的手法が必要なんだ。
連続的な結果の場合、研究者は2つのグループ間の平均差を推定する必要がある。二項結果、つまり治療の成功や失敗の場合は、各グループの成功の割合を考慮しなければならない。時間-イベント結果は、あるイベントが発生するまでの時間を測ることに関わるし、順序結果は自然な順序のあるカテゴリに関わるけど、厳密に数値的ではない。
非遵守とフォローアップの喪失
非遵守は、参加者が意図した治療計画に従わない場合に発生する。例えば、薬の服用を忘れたり、別の治療に切り替えたりすることがある。フォローアップの喪失は、参加者が試験から脱落してしまって、その結果が分からなくなることを指す。
非遵守とフォローアップの喪失は、試験の結果の妥当性に大きな影響を与える可能性がある。これらの問題を考慮せずにサンプルサイズを推定するのは危険で、意味のある治療間の違いを見逃すかもしれないから、ちゃんと考えなきゃいけない。
サンプルサイズ推定方法
現在、サンプルサイズ計算を助けるためにいろんなRパッケージがある。でも、多くのパッケージは非遵守やフォローアップの喪失を十分に考慮してない。新しく出た「GenTwoArmsTrialSize」パッケージは、より正確な計算を可能にすることでこのギャップを埋めようとしているんだ。
このパッケージを使うことで、研究者は異なるエンドポイントタイプや治療デザインに基づいてサンプルサイズを推定できる。非遵守やフォローアップの喪失を見積もるためのパラメータも組み込まれていて、臨床試験の設計をする人にとって貴重なツールなんだ。
GenTwoArmsTrialSizeパッケージの特徴
GenTwoArmsTrialSizeパッケージは、サンプルサイズの計算を簡単にするためのいくつかの機能を提供している。この機能は異なるエンドポイントのタイプを扱っていて、研究者が特定の試験デザインに関連するパラメータを入力できるようになってる。
連続エンドポイント
連続的な結果を測定する試験の場合、パッケージには必要なサンプルサイズを計算するための関数がある。研究者は期待される平均差、標準偏差、有意水準、その他の関連パラメータを入力して、試験の各群に必要な参加者数を決定できる。
二項エンドポイント
二項結果の場合、パッケージ内の別の関数がサンプルサイズの推定を可能にする。研究者は各グループの治療成功率の期待値を指定し、非遵守やフォローアップの喪失率を計算に組み込むことができる。
時間-イベントエンドポイント
このパッケージには、時間-イベントエンドポイントを持つ試験でのサンプルサイズ推定のための関数も含まれている。これには、治療のハザード率や試験全体の時間を考慮しつつ、非遵守やフォローアップの喪失を考慮することが含まれる。
順序カテゴリエンドポイント
最後に、GenTwoArmsTrialSizeパッケージは順序カテゴリ結果にも対応していて、研究者がカテゴライズされた反応に基づいてサンプルサイズを推定できるようにしている。この関数も他のエンドポイントタイプと同様に、非遵守やフォローアップの喪失を考慮できる。
実用的な例
GenTwoArmsTrialSizeパッケージがどのように機能するかを示すために、いくつかの異なる試験の例を提供できる。
例1: コレステロール薬試験
2つのコレステロール低下薬を比較する試験では、主な研究者が同等性試験のためのサンプルサイズを決定したいと考えている。標準偏差と真の平均差を仮定すると、研究者は連続エンドポイント関数を使って、5%の非遵守と10%のフォローアップ喪失を考慮して各治療群に必要な参加者数を計算できる。
例2: インスリン吸入器比較
ある製薬会社が2つの吸入インスリン製剤の安全性を評価するためのクロスオーバー試験を計画中。研究者は二項エンドポイント関数を使って、非遵守や期待される脱落率を計算に組み込んで有害事象率の違いを検出するのに必要なサンプルサイズを推定できる。
例3: がん生存研究
別の例は、異なる治療タイプを受けるがん患者の生存率を比較する試験。この場合、主な研究者は時間-イベントエンドポイント関数を用いて、患者の結果や遵守に関連する必要なパラメータを考慮しながら必要なサンプルサイズを推定できる。
サンプルサイズ推定の変動性
異なる試験において、非遵守率やフォローアップの喪失が必要なサンプルサイズにどのように影響するかを理解するのが超大事。非遵守や脱落率が上がると、試験に必要な参加者数は通常増える。
例えば、試験が完璧な遵守とフォローアップの喪失なしを仮定すると、必要なサンプルサイズはこれらの問題のレベルが高くなることを考慮した場合よりも小さくなるかもしれない。だから、研究者は研究を設計する際に現実的な非遵守や脱落の推定を選ぶことが超重要なんだ。
統計ソフトウェアの役割
統計ソフトウェアはサンプルサイズの推定において重要な役割を果たす。GenTwoArmsTrialSizeパッケージのようなツールを使うと、研究者は効率的に計算を行い、さまざまな試験シナリオを比較できる。これにより、さまざまな要因に基づいてサンプルサイズの推定値を迅速に調整でき、研究デザインのプロセスが改善される。
さらに、異なるソフトウェアパッケージの推定値を比較することで、異なる仮定の下で推定値がどのように変わるかについての洞察が得られる。これは、研究者が試験を計画し、堅固な結果を確保する際に超便利なんだ。
結論
GenTwoArmsTrialSizeパッケージは、臨床試験の設計分野における重要な進展だ。非遵守やフォローアップの喪失を考慮しながらサンプルサイズを推定できることで、試験計画により包括的なアプローチを提供している。
いろんなエンドポイントタイプや治療デザインに焦点を当てているこのパッケージは、製薬業界の統計学者にとって貴重なリソースなんだ。サンプルサイズを正確に計算できることは、研究者が資源を節約するのに役立つだけでなく、試験が倫理的かつ科学的に健全であることを保証する。
将来的には、このパッケージの機能がさらに拡張されて、追加の臨床試験デザインやバイオエクイバレンス試験を組み込むことができるようになるかもしれないし、適応デザインの方法も改善されるかもしれない。こうした改善があれば、臨床試験研究者が意味のある信頼できる結果を追求するのをさらにサポートできる。
最終的には、このパッケージが研究者がサンプルサイズについて情報に基づいた意思決定を行う力を与え、臨床試験の全体的な質を向上させ、より良い医療の成果に貢献することを目指しているんだ。
タイトル: GenTwoArmsTrialSize: An R Statistical Software Package to estimate Generalized Two Arms Randomized Clinical Trial Sample Size
概要: The precise calculation of sample sizes is a crucial aspect in the design of clinical trials particularly for pharmaceutical statisticians. While various R statistical software packages have been developed by researchers to estimate required sample sizes under different assumptions, there has been a notable absence of a standalone R statistical software package that allows researchers to comprehensively estimate sample sizes under generalized scenarios. This paper introduces the R statistical software package "GenTwoArmsTrialSize" available on the Comprehensive R Archive Network (CRAN), designed for estimating the required sample size in two-arm clinical trials. The package incorporates four endpoint types, two trial treatment designs, four types of hypothesis tests, as well as considerations for noncompliance and loss of follow-up, providing researchers with the capability to estimate sample sizes across 24 scenarios. To facilitate understanding of the estimation process and illuminate the impact of noncompliance and loss of follow-up on the size and variability of estimations, the paper includes four hypothetical examples and one applied example. The discussion encompasses the package's limitations and outlines directions for future extensions and improvements.
著者: Mohsen Soltanifar, Chel Hee Lee, Amin Shirazi, Martha Behnke, Ilfra Raymond-Loher, Getachew A. Dagne
最終更新: 2024-07-15 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2407.11342
ソースPDF: https://arxiv.org/pdf/2407.11342
ライセンス: https://creativecommons.org/licenses/by-nc-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://CRAN.R-project.org/package=GenTwoArmsTrialSize
- https://doi.org/10.1186/s13063-020-04546-1
- https://www.fda.gov/regulatory-information/search-fda-guidance-documents/
- https://doi.org/10.7602/jmis.2023.26.1.9
- https://doi.org/10.1136/bmj.311.7013.1145
- https://doi.org/10.1002/sim.4780122404
- https://doi.org/10.1093/epirev/24.1.39
- https://doi.org/10.1037/1082-989x.7.2.178
- https://CRAN.R-project.org/package=samplesize
- https://doi.org/10.32614/rj-2022-022
- https://CRAN.R-project.org/package=MedianaDesigner
- https://doi.org/10.1038/s41398-020-01095-8
- https://doi.org/10.1097/00002030-199501000-00001
- https://doi.org/10.1124/mi.11.2.8
- https://doi.org/10.1002/
- https://doi.org/10.1016/s0197-2456
- https://doi.org/10.1016/j.jvs.2023.04.011
- https://CRAN.R-project.org/package=Hmisc
- https://CRAN.R-project.org/package=TrialSize
- https://biostatistics.mdanderson.org/SoftwareDownload/SingleSoftware/Index/41
- https://CRAN.R-project.org/package=dplyr
- https://doi.org/10.1080/0020739x.2010.543160
- https://doi.org/10.1080/0025570x.2003.11953176
- https://CRAN.R-project.org/package=PowerTOST
- https://doi.org/10.1186/1745-6215-15-364
- https://doi.org/10.1177/0962280212465498
- https://doi.org/10.1093/ije/28.2.319
- https://doi.org/10.1177/0962280214547381
- https://doi.org/10.1201/b17822
- https://stat.ethz.ch/R-manual/R-devel/library/stats/html/00Index.html