SLE临床试验中能否通过核心领域集捕获疾病活动和治疗反应?III期belimumab试验数据分析Can disease activity and treatment responses be captured by a core set of domains in SLE clinical trials? An analysis of phase III belimumab trial data | Lupus Science & Medicine

环球医讯 / 创新药物来源:lupus.bmj.com澳大利亚 - 英语2026-05-24 01:30:02 - 阅读时长17分钟 - 8048字
本研究分析了两项III期系统性红斑狼疮(SLE)临床试验数据,探究了仅使用"核心领域集"评估疾病活动对治疗反应分类的影响。结果显示,核心领域集(包括黏膜皮肤、血液学、关节炎、浆膜炎和肾炎)能够捕获93.5%患者的基线疾病活动,且与完整评估相比,89.5%患者的治疗反应评估结果一致。这表明限制SLE临床试验的疾病活动评估领域可能简化试验终点,而不会对患者纳入或治疗反应分类产生显著负面影响,为开发更有效的SLE临床试验终点提供了依据。
系统性红斑狼疮(SLE)核心领域集belimumabBILAG指数临床试验治疗反应疾病活动黏膜皮肤血液学关节炎浆膜炎肾炎
SLE临床试验中能否通过核心领域集捕获疾病活动和治疗反应?III期belimumab试验数据分析

摘要

目的 系统性红斑狼疮(SLE)随机对照试验(RCT)中使用的结局测量方法阻碍了试验成功和药物获批。在一项正在进行的全球项目中,我们通过共识选择了一个"核心领域集"用于确定SLE RCT中的治疗反应。我们调查了将疾病活动评估限制在此核心领域集对RCT中反应者分类的影响。

方法 使用两项III期SLE RCT(系统性红斑狼疮患者中的Belimumab(BLISS)-52,NCT00424476;BLISS-76,NCT00410384)的基线和第52周汇总数据,我们将英国群岛狼疮评估组(BILAG)疾病活动指数的项目分为核心和非核心集。核心领域集包括86个BILAG项目中的30个项目,涵盖五个领域:黏膜皮肤(皮疹、脱发、黏膜溃疡)、血液学(血小板减少症、溶血性贫血)、关节炎、浆膜炎和肾炎。我们分析了基线疾病活动和第52周的治疗反应。

结果 我们分析了1526名患者。基线时,核心领域集捕获了使用完整BILAG捕获的大部分疾病活动(1526名患者中的1426名(93.5%))。最常见的非核心领域集表现包括皮肤血管炎、非溶血性贫血、白细胞减少、呼吸困难和疲劳。第52周时,约1426名患者中的1278名(89.5%)在仅使用核心领域集与使用所有BILAG项目测量的治疗反应方面表现出一致性。不一致性再次由皮肤血管炎、非溶血性贫血、白细胞减少和疲劳驱动。

结论 将治疗反应分类限制在核心领域集有可能简化SLE RCT终点,而不会对患者纳入或反应者分类产生显著负面影响。

已知内容

  • SLE临床试验传统结局测量中使用的疾病活动测量方法捕获了广泛的狼疮表现列表,包括许多罕见或难以精确测量的表现。
  • 作为开发SLE临床试验新型结局测量的一部分,将基于其重要性和在临床试验环境中的适用性,测量更小的"核心领域集"疾病活动领域以确定治疗反应;然而,在随机对照试验(RCT)环境中将疾病活动评估限制在此核心领域集的影响尚不清楚。

本研究新增内容

  • 当代SLE RCT中纳入的大多数疾病活动和患者可能由比传统测量更小的核心狼疮表现领域集捕获。
  • 与所有英国群岛狼疮评估组活动相比,使用核心狼疮领域集总体上可以类似地捕获治疗反应,不一致性由皮肤血管炎、非溶血性贫血、白细胞减少和疲劳驱动。

本研究对研究、实践或政策的潜在影响

  • 将治疗反应分类限制在疾病活动核心领域集有可能简化SLE RCT终点,而不会对患者纳入或反应者分类产生显著负面影响。
  • 这些结果将为SLE RCT新型终点的持续开发提供信息。

引言

SLE(狼疮)随机对照试验(RCT)中疾病活动和治疗反应的评估因其疾病的异质性而复杂化。SLE的表现多种多样,可影响身体的任何器官,并以任何组合出现。此外,疾病病程高度可变,且没有可靠的生物标志物能普遍与疾病活动波动相关。这挑战了SLE RCT中使用的主要疗效终点的可解释性,这些终点已被确定为导致反复无法证明药物有效性的因素。

疾病活动测量方法如英国群岛狼疮评估组(BILAG)指数和SLE疾病活动指数(SLEDAI)支撑着SLE临床试验中使用的传统治疗反应测量方法,即基于BILAG的复合狼疮评估(BICLA)和基于SLEDAI的SLE反应指数(SRI)。这些指数的设计试图捕获可能在活动性SLE中表现的广泛疾病特征谱;然而,它们在深入评估个别疾病特征方面能力有限。这种缺乏细致性使得解释SLE中的RCT结果变得困难,并阻碍了药物获批。此外,我们先前报告称SLE活动的许多器官领域在临床试验人群中很少出现,这一发现在大型真实世界队列中也有报道。这些考虑因素导致了核心领域集在临床试验环境中具有更大效用的概念。

治疗反应测量-系统性狼疮(SLE)(TRM-SLE)项目是一项正在进行的临床医生、患者和行业合作伙伴之间的国际合作,旨在开发一种新型临床结局评估,用于SLE RCT环境中测量治疗反应。TRM-SLE提出了一种基于优先详细测量简洁"核心领域集"疾病活动领域的多领域工具:黏膜皮肤(皮疹、脱发、黏膜溃疡)、血液学(血小板减少症、溶血性贫血)、关节炎、浆膜炎和肾炎。这些领域通过涉及临床医生和患者专家的修改版德尔菲共识研究选定,基于对患者的重要性、捕获活动性疾病的适当性、SLE RCT队列中的典型代表性以及在临床试验环境中的可测量性。然而,通过优先详细测量选定的疾病表现而非广度,可能忽略临床上重要的指示SLE疾病活动的疾病特征,这意味着使用此核心领域集可能无法捕获某些方面的疾病反应。

本研究的目的是调查将疾病活动评估限制在"核心领域集"的器官表现是否能够与评估疾病活动广度的现有结局测量方法相比,在SLE RCT中类似地捕获患者纳入和治疗反应。

方法

研究人群

我们对两项比较belimumab与安慰剂在标准SLE治疗基础上的III期SLE RCT的汇总数据进行了分析:BLISS-52(NCT00424476, n=865)和BLISS-76(NCT00410384, n=819)。数据通过临床研究数据请求联盟获取,获得葛兰素史克(GlaxoSmithKline,英国Uxbridge)的方案批准。

如原始出版物所述,BLISS研究的纳入标准包括:(a)年龄≥18岁,(b)符合1997年美国风湿病学会分类标准的SLE,(c)安全雌激素在狼疮红斑狼疮国家评估-SLE疾病活动指数(SELENA-SLEDAI)≥6,(d)血清学阳性,以及(e)入组前至少30天稳定的非生物药物治疗方案。排除标准包括严重活动性狼疮肾炎或神经精神性狼疮。在我们的研究中,汇总人群仅限于同时具有基线BILAG A或BILAG B疾病活动的患者(n=1526),更接近最近的RCT入组方法。

BLISS试验使用了三种关键疾病活动测量方法:BILAG指数、SELENA-SLEDAI和医生全局评估(PGA)。两项BLISS试验的主要终点是这三项评估的复合指标:SRI-4,定义为SLEDAI评分较基线降低≥4分;无新的BILAG A或不超过一个新BILAG B评分;且PGA未恶化≥0.3分。对于当前研究,我们分析了两个时间点的数据:第0周(基线)和第52周(主要终点评估时间)。

由于TRM-SLE仪器中领域活动的定义和阈值未在BLISS试验中捕获,我们使用BILAG指数数据作为TRM核心领域集疾病活动领域的占位符定义。选择BILAG来定义核心与非核心领域活动和反应,是因为它广泛覆盖了包括所有核心领域活动在内的SLE疾病特征。相比之下,SLEDAI未捕获溶血性贫血,而PGA仅在全局层面捕获疾病活动,因此不适合此目的。最近的事后分析表明BILAG已充分捕获了BLISS研究中的治疗效果。BLISS试验中使用的BILAG指数版本包含86个项目,分为八个领域:一般、黏膜皮肤、神经、肌肉骨骼、心肺、血管炎、肾脏和血液学。如果BILAG领域被评为A(严重活动)或B(中度活动),则被认为具有活动性。30个BILAG项目跨越五个BILAG器官领域被分配为代表TRM核心领域集,基于在之前导致领域选择的德尔菲共识过程中达成共识的纳入TRM-SLE的表现(皮疹、脱发、黏膜溃疡、血小板减少症、溶血性贫血、关节炎、浆膜炎和肾炎)。剩余56个BILAG项目被归类为非核心领域集表现。这意味着四个BILAG领域同时包含TRM核心和非核心领域集项目(黏膜皮肤、肌肉骨骼、心肺、血液学);三个BILAG领域仅包含非核心领域集项目(神经、血管炎、一般);一个BILAG领域仅包含核心领域集项目(肾脏)。核心和非核心领域集领域等级根据BILAG附录和词汇表分配。对于包含核心领域集和非核心领域集项目的混合BILAG领域,这包括为核心和非核心领域集领域活动生成单独的BILAG等级。具体项目分配包含在在线补充表1中。

我们首先比较了基线时核心领域集和非核心领域集活动在领域和患者水平上的患病率。然后我们评估了第52周的治疗反应,根据疾病活动改善来定义。在领域水平上,改善被定义为从基线BILAG A降至B、C或D,或从BILAG B降至C或D。在患者水平上,改善被定义为以下类别:非反应者(基线活跃的所有领域在第52周均无改善)、不完全反应者(基线活跃的至少一个但非所有领域在第52周改善)和完全反应者(基线活跃的所有领域在第52周改善)。为了确定使用TRM-SLE核心领域集是否会影响区分效度,我们还比较了belimumab 10 mg/kg剂量组与安慰剂组的完全反应者与非反应者。

统计分析

所有统计分析均使用Stata V.18.0(美国德克萨斯州College Station)进行。患者特征、基线疾病活动和第52周反应者状态被汇总为分类变量的频率和百分比(n, %)或连续变量的均值及相应标准差。对于区分效度分析,使用单变量逻辑回归分析计算反应者和非反应者组的比值比进行推断分析。报告了比值比和p值及其95%置信区间。

患者和公众参与

患者或公众未参与我们研究的设计、实施、报告或传播计划。

结果

基线人口统计学和疾病活动

分析了1526名患者的数据。基线人口统计学和疾病活动总结见在线补充表2。平均(标准差)年龄为37.99(11.6)岁,患者主要为女性(93.9%)和白种人(48.8%)。入组时,990名(64.9%)患者正在接受抗疟药物治疗,746名(48.9%)患者正在接受免疫抑制剂治疗,1312名(86.0%)患者正在接受糖皮质激素治疗。平均(标准差)SELENA-SLEDAI为9.98(3.7),54.5%(832名)患者的SELENA-SLEDAI≥10。平均(标准差)PGA评分为1.46(0.5),87.7%(1338名)患者的PGA>1。根据我们的研究纳入标准,分析的所有患者至少有一个器官领域具有BILAG A或B活动。基线时,17.2%(263名)患者存在BILAG A活动,而82.8%(1263名)患者仅存在BILAG B活动。关于基线时每位患者的活动领域数量,36.8%(561名)患者仅在一个器官领域有疾病活动,43.8%(668名)患者有两个活动领域,19.5%(297名)患者有三个或更多活动领域(见在线补充表3)。肌肉骨骼(66.0%)和黏膜皮肤(64.9%)疾病活动最为常见,无论作为单一活动领域还是组合(见在线补充表3)。

按核心领域集状态分层的基线疾病活动

研究人群中基线疾病活动的大部分由TRM-SLE核心领域集捕获。仅测量核心领域集疾病特征时,肌肉骨骼和黏膜皮肤疾病活动几乎完全(>99%)被捕获。仅测量核心领域集特征时,肾脏疾病活动被完全捕获。相比之下,在心肺和血液学领域,非核心领域集项目构成了基线疾病活动的大部分。非核心领域集疾病活动负责73.8%的心肺领域活动,其中97.8%(44/45)是由于呼吸困难。同样,血液学领域86.3%的活动是非核心领域集的,其中83.3%(195/234)是由于非溶血性贫血。三个领域(一般、血管炎和神经)完全不在核心领域集中。在一般和血管炎领域中,疾病活动由单一突出疾病特征驱动:97.8%(183名中的179名)的一般领域活动归因于疲劳/不适/嗜睡,99.3%(151名中的150名)的血管炎领域活动归因于皮肤血管炎。神经系统疾病活动分布在多种疾病表现中;然而,总体上具有神经系统疾病活动的样本非常小(n=21)。值得注意的是,BILAG A级疾病活动几乎完全被核心领域集捕获。非核心领域集BILAG A活动对每个领域的活动贡献不到0.6%,血管炎例外(49名患者,3.2%有主要皮肤血管炎)。

基线疾病活动完全由核心领域集捕获的患者有1426/1526(93.5%)名。在研究人群中,核心领域集活动仅在一个领域发生的患者有46.7%(713名),而42.3%(645名)患者基线时有两个核心领域集活动,不到5%的患者至少有三个核心领域集活动(见在线补充表3)。仅6.6%(100名)患者基线时仅存在非核心领域集BILAG A或B疾病活动,因此如果改善评估仅限于核心领域集,则这些患者将被排除在反应评估之外。在这100名患者中,84%基线时仅在一个非核心领域集领域活跃。该组中最常活跃的领域是血液学(46%)、血管炎(29%)和一般(20%)。

第52周疾病活动改善

我们将仅由核心领域集特征定义的反应(核心领域集反应)与通过测量所有86个BILAG项目定义的反应(BILAG反应)进行了比较(表2)。此分析排除了基线时无核心领域集活动的100名患者。这些被排除患者的特征与总研究人群一起显示在在线补充表2中;该被排除子集中的患者更可能是非白种人,更可能在入组研究时接受免疫抑制剂治疗并具有BILAG 1B活动。在患者水平上,BILAG反应率为:47.5%(678名)在所有活跃领域改善(完全反应者),29.7%(424名)在某些但非所有活跃领域改善(不完全反应者),22.7%(324名)未显示任何基线活动改善(非反应者)。仅由核心领域集特征定义的反应如下:52.9%(754名)为完全反应者,19.4%(276名)为不完全反应者,27.8%(396名)为非反应者。因此,1278名(89.5%)患者在仅基于核心领域集特征测量与基于BILAG疾病特征完整集的分类中具有反应状态一致性,148名(10.4%)参与者在仅测量核心领域集特征与BILAG疾病特征完整集时具有不一致的反应状态。

我们进一步研究了具有不一致核心领域集和BILAG反应状态的患者群体(表3)。在此组中,72名(48.6%)患者基于核心领域集为非反应者,但在第52周有一个或多个非核心领域集领域改善。在这些患者中,最常见改善的非核心领域集领域是血管炎(主要是皮肤血管炎)、血液学(非溶血性贫血和/或白细胞减少)和一般(主要是疲劳/不适/嗜睡)。相反,76名(51.4%)患者基于核心领域集为完全反应者,但基线活跃的一个或多个非核心领域集领域未改善。在这些患者中,血液学活动无改善(非溶血性贫血和/或白细胞减少)是最常见发现(80.3%)。

最后,我们分析了belimumab 10 mg/kg剂量组与安慰剂组之间完全反应者与非反应者的比率差异,使用两个队列。重要的是,此分析解决了BILAG等级改善,而非非反应者归因的其他组成部分,如药物违规。分析表明,TRM核心领域集具有至少相当的区分效度(p=0.042),而BILAG为(p=0.058)(见表4)。

讨论

SLE是一种异质性疾病,其特征是表现谱广泛,从几乎普遍存在到极其罕见不等。尽管如此,关于基线时具有多器官受累的患者中不同表现的治疗反应轨迹的文献却很少。多项注册表和临床试验数据集研究表明,SLE中绝大多数疾病活动都集中在相对较少的领域中,这导致了在临床试验环境中测量疾病活动和对治疗的反应可以简化而不损失敏感性的概念。TRM-SLE这一新型结局评估工具由国际工作组开发,通过全面的共识过程确定了SLE试验中测量的核心领域集。这有可能简化试验结局测量,允许对临床试验人群中最相关的活跃表现进行详细评估,从而提高SLE临床试验的可解释性。然而,确定将测量限制在此核心领域集是否会失去重要的临床意义以及敏感性和特异性是必要的。在这里,我们使用BLISS试验数据集评估了与BILAG指数描述的更全面的领域集相比,限制在TRM-SLE结局测量开发中包含的核心领域集的影响。

本研究结果表明,BLISS试验中基线时绝大多数临床重要的疾病活动可通过有限的核心器官领域集捕获。肌肉骨骼和黏膜皮肤疾病活动在核心领域集中得到全面捕获,仅有不到1%的患者中这些两个器官系统中的罕见事件落在核心领域集之外。严重疾病活动(BILAG A)很少被核心领域集遗漏,主要皮肤血管炎是显著例外。在患者水平上,核心领域集捕获了基线时93%以上的患者;因此,这一少数患者将不符合仅由TRM核心领域集定义的反应评估资格,并将在仅定义核心领域集的试验中被排除。该患者组的大多数人仅在一个领域活跃,主要是非核心领域集的血液学或一般领域,并且基线时总体疾病较轻。

重要的是,核心领域集未捕获的大多数基线疾病活动特征不适合用于评估SLE中的治疗反应。常见的非核心领域集特征,包括非溶血性贫血、呼吸困难和疲劳/不适/嗜睡,在TRM-SLE领域选择德尔菲过程中已被考虑,但被认为不适合测量疾病活动改善,因此未达成共识纳入最终仪器。一个重要例外是皮肤血管炎的省略,它在BLISS人群中基线时存在于13%的患者中。虽然承认其在SLE RCT中测量的重要性和适当性,但由于缺乏适合评估治疗反应的可用结局测量,血管炎未包含在TRM-SLE核心领域集中。因此,我们的研究结果表明,开发在SLE环境中测量皮肤血管炎的方法是一个研究需求领域,以便在TRM-SLE结局测量的未来迭代中捕获血管炎疾病活动。

显然,任何结局测量在试验中的效用取决于其检测对治疗的临床有意义变化的能力。仅使用核心领域集测量的第52周治疗反应与使用所有86个BILAG疾病特征测量的反应高度一致。此外,核心领域集区分belimumab 10 mg/kg治疗组与安慰剂组的能力在两种方法中相当。核心领域集和BILAG定义之间的反应状态不一致性主要由非溶血性贫血和/或白细胞减少驱动,主要是核心领域集领域改善但非溶血性贫血和/或白细胞减少未改善的情况。SLE中的非溶血性贫血最常见为慢性疾病性贫血,通常在 flare 临床缓解后仍持续存在,因此可能不太适合用于量化RCT环境中的治疗反应。SLE患者中非溶血性贫血的其他原因包括缺铁、出血或肾性贫血,这些均不直接反映SLE导致的血液学受累。此外,虽然白细胞减少的改善被认为反映血液学疾病改善,但对整体患者结果影响最小,且通常受药物或感染等因素影响。有趣的是,疲劳也是不一致的常见原因;虽然在SLE中无疑重要,但疲劳是SLE疾病活动状态的不可靠测量指标,因为它不会可靠地响应免疫调节治疗。然而,重要的是,皮肤血管炎也是不一致的来源,即治疗反应不会被TRM-SLE核心领域集捕获;值得注意的是,这将导致反应者误分类(即核心领域集有反应但血管炎无反应)仅影响3名患者,而未能检测到23名患者的反应。

本研究存在一些局限性。由于本研究与TRM-SLE仪器开发阶段同时进行,核心与非核心领域活动和治疗反应的分析基于BILAG指数,而非TRM-SLE中正在开发的基于连续变量的指标。然而,本研究的目的是评估限制测量疾病活动的领域的影响,我们认为BILAG指数数据适合此目标。其次,我们承认试验纳入标准造成的选择偏倚,这些标准排除了严重神经精神性狼疮和狼疮肾炎。第三,BLISS试验使用了原始BILAG指数,其中包含在2004年修订版中被认为过于模糊或不良活动性疾病指标而被移除的疾病特征。最值得注意的是,血管炎在BILAG-2004中不存在为单独领域,而是选择疾病特征重新分配到其他器官领域中。BILAG-2004还包括胃肠道和眼科狼疮,这些都将被归类为非核心领域集领域,可能提供有关核心领域集全面性的额外见解,尽管这些领域在临床试验环境中表现罕见。

总之,本研究表明,在SLE RCT中测量较少的疾病活动领域可以充分捕获绝大多数患者水平的疾病活动和治疗反应。尽管如此,我们确定皮肤血管炎是一个可能需要进一步研究以推导有效测量方法的领域。通过限制评估的领域数量,更可行的是更详细地测量每个单独领域,例如使用连续变量,这可能更简单、更可靠。本研究结果支持德尔菲专家共识过程的结果,该过程导致了将在TRM-SLE结局测量中测量的核心领域集。

【全文结束】

猜你喜欢
  • 性别和抗瓜氨酸化蛋白抗体影响类风湿关节炎中炎症与心血管风险的关系性别和抗瓜氨酸化蛋白抗体影响类风湿关节炎中炎症与心血管风险的关系
  • 儿童自身免疫疾病儿童自身免疫疾病
  • 韩国系统性红斑狼疮患者具有独特的肠道微生物组特征韩国系统性红斑狼疮患者具有独特的肠道微生物组特征
  • 儿童也患狼疮等疾病 研究人员寻求更佳治疗方法儿童也患狼疮等疾病 研究人员寻求更佳治疗方法
  • 目标治疗策略缩短类风湿关节炎女性妊娠时间目标治疗策略缩短类风湿关节炎女性妊娠时间
  • 美国风湿病学会发布2025年系统性红斑狼疮治疗指南美国风湿病学会发布2025年系统性红斑狼疮治疗指南
  • 系统性红斑狼疮中的认知功能障碍:巴西队列两年纵向研究的见解系统性红斑狼疮中的认知功能障碍:巴西队列两年纵向研究的见解
  • 药物开发与微生物组影响药物开发与微生物组影响
  • 单一注射数周内逆转骨关节炎 动物实验成功能否改变英国治疗现状?单一注射数周内逆转骨关节炎 动物实验成功能否改变英国治疗现状?
  • 类风湿关节炎与颈动脉斑块:五大要点须知类风湿关节炎与颈动脉斑块:五大要点须知
热点资讯
全站热点
全站热文