样本量的合理性是规划临床试验时的重要考虑因素,不仅对主要试验如此,对任何初步的先导试验也是如此。当结果变量为连续变量时,样本量计算需要准确估计结果测量的标准差。先导试验可以用来获取标准差的估计值,然后用于预测在主要试验中可能观察到的情况。然而,一个重要的考虑是先导试验往往对标准差参数的估计不够精确。本文探讨了如何选择外部先导试验的样本量,以最小化整个临床试验计划的样本量,即先导试验和主要试验的总样本量。我们提出了一种计算所需先导试验样本量的最佳解决方案的方法,前提是已知主要试验的标准化效应大小。然而,由于在先导试验之前可能无法知道将要使用的标准化效应大小,因此也提供了近似规则。对于设计为90%功效和双侧5%显著性的主要试验,我们建议以下先导试验每治疗组的样本量:对于非常小(≤0.1)、小(0.2)、中等(0.5)或大(0.8)的标准化效应大小,分别推荐75、25、15和10。
- 样本量调整方法:
- UCL方法:使用方差的单侧X%上限来计划主要试验。Browne建议使用80%的置信水平,而Sim和Lewis则建议使用95%的置信水平。
- NCT方法:Julious和Owen建议的一种替代方法,该方法考虑到我们使用的是样本方差而不是总体方差。
- 先导试验样本量:
- 传统的样本量公式通常不适用于先导试验,因为先导试验的目的不是评估疗效而是测试试验程序和过程,并为主试验样本量计算提供参数估计。
- 当前的方法基于固定的经验法则,例如每个治疗组至少30名受试者或总共70名受试者。这些经验法则的局限性在于它们忽略了主试验的规模,可能导致整体样本量次优。
- 优化方法:
- 通过使用标准化差异(d/s)和先导试验样本量的不同组合,可以计算出所有变量组合的主要试验所需样本量。
- 通过迭代求解,可以找到使整体试验样本量最小化的先导试验样本量。如果已知主要试验的标准化效应大小,则可以精确计算最优先导试验样本量。
- 如果标准化效应大小未知,可以基于Cohen设定的小、中、大效应大小来制定先导试验样本量的经验法则。
- 结果:
- 通过模拟和理论计算,NCT方法提供的整体试验样本量最低,同时保持平均功效接近名义水平。
- 对于不同效应大小,推荐的先导试验样本量如下:对于非常小(≤0.1)、小(0.2)、中等(0.5)或大(0.8)的标准化效应大小,分别推荐每治疗组75、25、15和10。
- 讨论:
- 本研究提出的样本量估算方法将先导试验视为整个研究计划的一部分,而非独立的研究。这种方法在维持名义功效的同时,最小化了整体试验样本量。
- 如果需要进行更简单的计算,建议使用文中提出的分步经验法则来设定先导试验样本量。但如果已知主要试验的标准化效应大小,建议使用精确计算方法。
(全文结束)

