据研究人员称,一种所谓的深度学习人工智能(AI)算法在分析MRI扫描以检测轴向脊柱关节炎(axSpA)患者的骶髂关节(SIJ)炎症方面表现出“可接受”的一致性。比利时布鲁塞尔UCB Pharma的Joeri Nicolaes博士及其同事报告称,该AI算法在731张患者图像中与三位中心读片专家组成的“金标准”小组达成了相同的结论,共有543张图像,其中304张图像双方均发现了炎症,239张图像双方均未发现炎症。
然而,在剩余的132个病例中,专家读片者识别出了算法未能发现的炎症。此外,算法在最后56张图像中错误地标记了炎症,而专家认为这些图像中没有炎症。假设人类读片者总是正确的,这是此类研究的常规做法,这导致了AI系统的统计性能如下:
- 绝对一致性:74%(95% CI 72-77)
- 敏感性:70%(95% CI 66-73)
- 特异性:81%(95% CI 78-84)
- 阳性预测值:84%(95% CI 82-87)
- 阴性预测值:64%(95% CI 61-68)
- Cohen's kappa:0.49(95% CI 0.43-0.55)
Nicolaes及其同事承认这些数值本身并不出色,但他们指出了一些缓解情况。“[必须考虑到]用于定义MRI上炎症的标准(≥2个骶髂关节有炎症)是保守的,而且本研究中的专家读片者可能在确定炎症存在时使用了其他上下文或临床信息(例如,CRP水平或HLA-B27阳性),”他们写道。
研究人员认为,他们的专家小组可能比一些现实世界中的临床医生(如普通风湿病学家和放射科医生)更专业,后者解释MRI图像——“进一步支持了在缺乏专家读片者的情况下使用机器学习算法的潜在用例。”即使在最坏的情况下,这样的算法至少可以提供可重复的结果,而不像人类读片者的解释可能会因人而异。
总体而言,他们得出结论,该系统“能够按照已发布的指南定义可接受地检测到炎症。”
研究细节
该算法之前已经开发并报告过,使用了来自法国观察队列的256名axSpA患者的数据。当前的研究旨在在一个更大、无关的患者群体中验证其性能。这些患者来自两个由UCB资助的临床试验,分别是RAPID-axSpA(152名患者)和C-OPTIMISE(579名患者)。这两个试验都在测试放射学和非放射学axSpA的药物,基线时进行了MRI扫描作为各自协议的一部分。
试验参与者的平均年龄约为34岁,三分之二是男性;平均病程约为5年。超过90%的参与者是白人。约45%的患者患有放射学axSpA。根据标准临床评估(例如,巴斯强直性脊柱炎疾病活动指数评分≥4)确定的活动性疾病是原始试验的入选条件。
专家分析由两名读片者进行;如果他们在骶髂关节炎症的存在上意见不一致,则会邀请第三位读片者打破僵局。如上所述,阳性发现要求至少有两个骶髂关节显示出炎症。
一个重要限制——对于研究和AI系统的临床实用性来说——是,在C-OPTIMISE的11,116名患者中,有129名患者的扫描图像因为图像大小或切片数量超出设计规格而无法被算法处理。(在RAPID-axSpA的172名患者中,也有8名患者的情况相同。)
Nicolaes及其同事还指出,自算法首次设计以来,关于骶髂关节炎症的标准分类标准已经发生变化,因此需要未来的更新。目前,该算法还无法检测结构损伤,这也是临床医生在治疗计划中依赖的信息。
(全文结束)

