Bias of Treatment Effect Estimation in Hybrid Goldilocks Adaptive Design: A Simulation Study

We studied bias from early stopping in a Bayesian Goldilocks design with a frequentist final analysis. We simulated a two-arm trial motivated by a previous trial for the treatment of pulmonary embolism. The continuous outcome was generated under small, moderate, and large treatment effects. Interim analyses occurred after 100 patients and every 50 thereafter to a maximum of 500. Trials stopped for efficacy if PP for success at current sample size exceeds 0.95 or futility if PP at the maximum sample size is below 0.05. Final analysis used a one-sided Wilcoxon–Mann–Whitney test. Across 10,000 simulations per scenario, the design reduced median sample size by 54%. Early success occurred in >79% of trials. Among trials stopping early, median relative bias ranged from 15–20% for small effects, 10–13% for moderate effects, and 5–6% for large effects, with greatest bias at early interims.The Goldilocks design yields substantial efficiency gains but introduces notable bias when stopping early.

Biais dans l'estimation de l'effet du traitement dans la conception adaptative hybride Goldilocks : une étude par simulation

Nous avons étudié le biais lié à l'arrêt prématuré dans un plan bayésien "Boucles d'or" (Goldilocks) avec une analyse finale fréquentiste. Nous avons simulé un essai à deux bras inspiré d'un essai précédent sur le traitement de l'embolie pulmonaire. Le réponse continue a été générée sous l'effet de traitements à faible, modérée et forte efficacité. Des analyses intermédiaires ont été réalisées après 100 patients, puis tous les 50 patients jusqu'à un maximum de 500. Les essais ont été interrompus pour des raisons d'efficacité si la PP de réussite pour la taille d'échantillon actuelle dépassait 0,95 ou pour des raisons de futilité si la PP pour la taille d'échantillon maximale était inférieure à 0,05. L'analyse finale a utilisé un test unilatéral de Wilcoxon-Mann-Whitney. Sur 10 000 simulations par scénario, le plan a réduit la taille médiane de l'échantillon de 54 %. Une réussite précoce a été observée dans plus de 79 % des essais. Parmi les essais interrompus prématurément, le biais relatif médian variait de 15 à 20 % pour les effets faibles, de 10 à 13 % pour les effets modérés et de 5 à 6 % pour les effets importants, le biais le plus important étant observé lors des analyses intermédiaires précoces. La conception Goldilocks permet de gagner considérablement en efficacité, mais introduit un biais notable en cas d'arrêt prématuré.

Session

Student Research Poster Presentation Award Competition

Date and Time