Verzögerungen in Gruppen-sequentiellen Studien managen
Wie Verzögerungen die Effizienz von adaptiven Studiendesigns beeinflussen.
― 8 min Lesedauer
Inhaltsverzeichnis
In der klinischen Forschung erlauben adaptive Designs den Forschern, Aspekte einer Studie basierend auf den eingehenden Patientendaten zu ändern. Diese Designs können Studien effizienter und flexibler machen. Wenn es jedoch zu Verzögerungen bei den Hauptergebnissen einer Studie kommt, kann das den Nutzen dieser adaptiven Designs schmälern.
Wenn die Ergebnisse verzögert eintreffen, müssen die Forscher entscheiden: Sollten sie die Rekrutierung neuer Patienten pausieren, bis genügend Daten vorliegen, um die Ergebnisse zu überprüfen? Das könnte die Studie verlängern. Oder sollten sie weiter rekrutieren, auch wenn viele neue Patienten möglicherweise nicht von der Zwischenanalyse profitieren und dies die Effizienz der Studie verringern könnte?
Es wurde bisher nicht viel unternommen, um herauszufinden, wie lange diese Verzögerungen sein können, bevor die Vorteile adaptiver Designs im Vergleich zu traditionellen, fixen Stichprobenmethoden verloren gehen. Diese Studie konzentriert sich auf gruppen-sequenzielle Designs (GSDs) mit zwei Gruppen und untersucht, wie unterschiedliche Verzögerungen bei den Ergebnissen die Effizienz dieser Studien beeinflussen können.
Methoden
Um zu sehen, wie eine Verzögerung die Effizienz beeinflusst, haben wir Formeln erstellt, um die Anzahl zusätzlicher Patienten in Zwei-Arm-GSDs mit normalen Daten zu berechnen, je nachdem, wie die Patienten rekrutiert werden. Normalerweise überprüfen wir die Effizienz einer GSD, indem wir die erwartete Stichprobengrösse (ESS) betrachten. GSDs reduzieren normalerweise die ESS im Vergleich zu traditionellen Designs ohne Zwischenprüfungen.
Unsere Formeln helfen uns zu verstehen, wie viel Effizienz durch Verzögerungen beim Sehen von Ergebnissen verloren geht. Wir prüfen auch, ob sorgfältige Designentscheidungen, wie z.B. wie oft Zwischenanalysen stattfinden, helfen können, die Vorteile der GSDs trotz Verzögerungen aufrechtzuerhalten. Zudem analysieren wir, wie GSDs in Bezug auf die Zeit abschneiden, die benötigt wird, um die Studie abzuschliessen.
Ergebnisse
Wenn man die erwarteten Effizienzgewinne betrachtet und Verzögerungen einbezieht, zeigt sich, dass GSDs viel verlieren können. Selbst eine kleine Verzögerung kann die Effizienz der Studie stark beeinflussen. Auf der anderen Seite neigen GSDs dazu, schneller abzuschliessen als eine einphasige Studie, selbst bei erheblichen Verzögerungen. Die Anzahl der Phasen in einer GSD hat einen geringen Einfluss auf die Effizienzverluste, aber das Timing der Zwischenanalysen kann die Effizienz einer GSD während Verzögerungen erheblich beeinflussen.
Fazit
Verzögerungen beim Sehen der Behandlungsergebnisse wirken sich negativ auf die Effizienz einer GSD aus. Selbst kleine Verzögerungen, besonders wenn die Rekrutierung beschleunigt wird, können zu erheblichen Verlusten führen. Ausserdem kann es schädlich für das Design sein, Zwischenanalysen auf später in der Studie zu verschieben, falls es eine Verzögerung gibt.
Schlüsselwörter
Adaptives Design, Zwischenanalyse, Mehrphasen, Zweiphasig.
Einführung
Gruppen-sequenzielle Designs (GSDs) werden oft in Zwei-Arm-randomisierten kontrollierten Studien (RCTs) verwendet, besonders in den späteren Phasen der Entwicklung neuer Medikamente. GSDs ermöglichen es, die Ergebnisse zu mehreren Zeitpunkten während der Studie zu überprüfen, was zu einem frühen Abbruch führen kann, wenn sich die Behandlung als wirksam oder unwirksam herausstellt.
Diese Designs versprechen mehr Effizienz, besonders was die Zeit betrifft, die benötigt wird, um die Studie abzuschliessen, oder die Anzahl der benötigten Patienten im Vergleich zu traditionellen Designs, die nur einmal am Ende die Ergebnisse überprüfen. Allerdings können die potenziellen Vorteile von GSDs erheblich beeinträchtigt werden, je nachdem, wie lange es dauert, die Behandlungsergebnisse zu sehen.
Wenn die Ergebnisse einer Studie verzögert eintreffen, kann dies die Gesamtdauer der Studie verlängern, wenn die Rekrutierung bei jeder Zwischenanalyse stoppt, oder die Kosten in die Höhe treiben, wenn die Rekrutierung fortgesetzt wird und viele neue Patienten nicht zu den Ergebnissen beitragen.
Nehmen wir beispielsweise eine Studie, die ein neues Medikament gegen die aktuelle Standardbehandlung testet. Wenn das primäre Ergebnis ein Jahr nach Behandlungsbeginn gemessen wird, könnte ein dreiphasiger GSD zunächst 66, 134 und 200 Patienten in jeder Phase benötigen, während eine einphasige Studie etwa 196 Patienten benötigen könnte. Wenn die Forscher planen, zwei Jahre für die Rekrutierung von Patienten einzuplanen, müssen sie etwa 8 Patienten pro Monat rekrutieren. Wenn die Rekrutierung während der Zwischenanalysen weiterläuft, könnten bis zum Zeitpunkt, an dem sie Ergebnisse von der ersten Gruppe von 66 Patienten erhalten, zusätzlich 96 Patienten unnötig behandelt worden sein.
Je länger es dauert, die primären Ergebnisse zu sehen, oder je schneller die Rekrutierung der Patienten erfolgt, desto ineffizienter wird die Studie. Einige Forscher haben untersucht, wie diese Verzögerungen einarmige Studien beeinflussen, insbesondere in der Onkologie. Eine Studie hat gezeigt, dass das effektivere Design gewählt werden könnte, basierend auf dem Verhältnis von Verzögerung zur Zeit, die benötigt wird, um Teilnehmer zu rekrutieren.
Es gibt jedoch immer noch eine Lücke im Verständnis, wie Verzögerungen spezifisch die zweiarmigen GSDs beeinflussen, die oft mehr als zwei Phasen haben. Einige Forscher haben diskutiert, wie Verzögerungen GSDs mit gleichmässig verteilten Zwischenanalysen und konstanten Rekrutierungsraten beeinflussen, aber dieses Gebiet benötigt mehr Erkundung.
Diese Studie zielt darauf ab, genauer zu betrachten, wie Verzögerungen bei den Behandlungsergebnissen die Effizienz von GSDs beeinflussen und ob verschiedene Designs helfen können, verlorene Vorteile zurückzugewinnen.
Design und Setup
Wir konzentrieren uns auf einen zweiarmigen GSD, um zu testen, ob eine neue Behandlung besser funktioniert als die bestehende Option. Wir schauen uns an, wie viele Patienten in jeder Phase rekrutiert werden, und nehmen an, dass es höchstens drei Phasen gibt.
Zur Klarheit nehmen wir an, dass die Behandlungsreaktion eines Patienten einer bekannten Verteilung folgt. Die Suche nach dem effektivsten Design hängt davon ab, wie kraftvoll die Studie eingerichtet ist, um die Behandlung gegen die Kontrolle zu testen, während signifikante Ergebnisse sichergestellt werden.
Jede Zwischenanalyse (IA) hat spezifische Abbruchregeln basierend auf den gesammelten Daten. Die Studie kann frühzeitig für Wirksamkeit oder Nutzlosigkeit basierend auf diesen Analysen abgebrochen werden.
Datensammlung
Um mögliche Verzögerungen bei den Ergebnissen zu berücksichtigen, nehmen wir an, dass die Antworten eine festgelegte Zeit nach der Rekrutierung eines Patienten eintreffen. Wenn die Rekrutierung über jede Zwischenanalyse hinaus weitergeht, werden zusätzliche Teilnehmer während dieser Wartezeit rekrutiert.
Wir werden die erwartete Anzahl zusätzlicher oder "Pipeline"-Patienten bei jeder Zwischenanalyse berechnen, wobei wir verschiedene Rekrutierungsmodelle betrachten. Je nach verwendeter Methode können diese zusätzlichen Patienten erheblichen Einfluss darauf haben, wie effizient die gesamte Studie ist.
Untersuchung der Auswirkungen von Verzögerungen auf den Studienabschluss
Während wir normalerweise die Effizienz anhand der erwarteten Stichprobengrösse messen, kann in einigen Fällen, wie z.B. bei von Pharmaunternehmen finanzierten Studien, der Fokus eher darauf liegen, wie lange es dauert, die Studie abzuschliessen.
Um zu erkunden, wie Verzögerungen beim Sehen von Behandlungsergebnissen die Zeit beeinflussen, die benötigt wird, um eine Studie abzuschliessen, summieren wir die gesamte Zeit, die benötigt wird, um Patienten zu rekrutieren und wann wir ihre Behandlungsergebnisse beobachten.
Unter der Annahme einer GSD mit Phasen von Patienten können wir die benötigte Zeit zur Rekrutierung aller erforderlichen Patienten herausfinden und die Zeit hinzufügen, die benötigt wird, um ihre Ergebnisse zu sehen.
Die erwartete Abschlusszeit wird auch Zeit für die Analyse umfassen und kann durch die Rekrutierungsmethode beeinflusst werden, sei es gleichmässig oder linear ansteigend.
Zusammenfassung der Ergebnisse
Wir haben festgestellt, dass mit zunehmender Verzögerung beim Sehen der Ergebnisse die Effizienzverluste steigen. Unter verschiedenen Rekrutierungsmodellen, wenn die Verzögerung ein Viertel der gesamten Rekrutierungszeit übersteigt, gehen die erwarteten Effizienzgewinne typischerweise verloren.
In Studien mit ungleichmässig verteilten Zwischenanalysen kann es schädlich sein, die Zwischenanalysen auf später in der Studie zu verschieben. Das unterstreicht die Idee, dass die Art und Weise, wie wir diese Analysen anordnen, die Effizienz erheblich beeinflussen kann.
Auswirkungen auf zukünftige Studien
Die Ergebnisse deuten darauf hin, dass GSDs mehr Vorteile hinsichtlich der Abschlusszeit von Studien bieten als einphasige Designs, selbst bei Verzögerungen. Wenn Verzögerungen auftreten, könnte die Verwendung eines zweiphasigen Designs zu geringeren Effizienzverlusten im Vergleich zu mehrphasigen Designs führen.
Insgesamt scheint es besser zu sein, die Zwischenanalysen früher in der Studie durchzuführen, insbesondere wenn Verzögerungen bei den Ergebnissen zu erwarten sind. Die Ergebnisse dieser Studie unterstreichen die Wichtigkeit, mögliche Verzögerungen bei klinischen Studien genauer zu betrachten, um die Effizienz aufrechtzuerhalten.
Eine weitere Erkundung ist nötig, um zu quantifizieren, wie verschiedene Parameter die Effizienzverluste beeinflussen und um Richtlinien für die Gestaltung von Studien zu entwickeln, die unvermeidliche Verzögerungen beim Auffinden von Behandlungsergebnissen standhalten können.
Titel: Evaluating the impact of outcome delay on the efficiency of two-arm group-sequential trials
Zusammenfassung: Adaptive designs(AD) are a broad class of trial designs that allow preplanned modifications based on patient data providing improved efficiency and flexibility. However, a delay in observing the primary outcome variable can harm this added efficiency. In this paper, we aim to ascertain the size of such outcome delay that results in the realised efficiency gains of ADs becoming negligible compared to classical fixed sample RCTs. We measure the impact of delay by developing formulae for the no. of overruns in 2 arm GSDs with normal data, assuming different recruitment models. The efficiency of a GSD is usually measured in terms of the expected sample size (ESS), with GSDs generally reducing the ESS compared to a standard RCT. Our formulae measures the efficiency gain from a GSD in terms of ESS reduction that is lost due to delay. We assess whether careful choice of design (e.g., altering the spacing of the IAs) can help recover the benefits of GSDs in presence of delay. We also analyse the efficiency of GSDs with respect to time to complete the trial. Comparing the expected efficiency gains, with and without consideration of delay, it is evident GSDs suffer considerable losses due to delay. Even a small delay can have a significant impact on the trial's efficiency. In contrast, even in the presence of substantial delay, a GSD will have a smaller expected time to trial completion in comparison to a simple RCT. Although the no. of stages have little influence on the efficiency losses, the timing of IAs can impact the efficiency of a GSDs with delay. Particularly, for unequally spaced IAs, pushing IAs towards latter end of the trial can be harmful for the design with delay.
Autoren: Aritra Mukherjee, Michael J. Grayling, James M. S. Wason
Letzte Aktualisierung: 2023-06-07 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2306.04430
Quell-PDF: https://arxiv.org/pdf/2306.04430
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.