克利夫兰诊所的研究人员开发了一种深度学习模型,该模型可以帮助在心脏磁共振成像(CMR)中区分心脏淀粉样变性与其他疑似心肌病的病因,尤其是在诊断不明确的情况下。他们在《JACC: 心血管影像学》杂志上发表了一篇新的研究文章,详细描述了该模型及其验证过程。
该模型的算法有可能被集成到临床决策支持工具中,以提高诊断准确性,特别是在那些阅读CMR经验较少的中心。研究表明,从首次出现心脏淀粉样变性的症状到确诊的中位延迟时间为2.6至3.4年,约有三分之一到一半的患者被误诊,最常见的是被误诊为肥厚型心肌病(HCM)。这两种疾病在CMR上可能表现为增厚的心肌。
这项研究的主要调查员、克利夫兰诊所心脏MRI主任Deborah Kwon博士表示:“最常见的CMR指征是评估疑似心肌病。”她解释说:“心脏淀粉样变性和HCM都有特定的组织特征,可以很容易地区分这两种疾病,尤其是在疾病进展较严重时。然而,患者可能会表现出不符合教科书影像特征的非典型表现,因此诊断存在不确定性。”
共同作者、心脏病学家兼克利夫兰诊所淀粉样变性中心主任Mazen Hanna博士补充道:“鉴于这两种疾病的临床特征和CMR表现存在重叠,但治疗方法和预后完全不同,这项研究是一个重要的进展方向。”
挑战:克服诊断不确定性
诊断不确定性在疾病早期最大。随着对心脏淀粉样变性认识的增加,疑似患有该病的患者比过去更早地被转介进行CMR检查。同时,最近出现了改变疾病的治疗方法。“以前,心脏淀粉样变性的诊断通常意味着预后不佳,”Kwon博士说,“但现在,这些患者的治疗选择越来越多。许多研究表明,越早诊断这些患者,他们的预后越好。”
为了应对诊断不确定性问题,Kwon博士与数据科学家David Chen博士及其同事使用了一种相对较新的深度学习模型——视觉变换器(ViT),这种模型在准确性和计算效率方面优于旧的卷积神经网络。
ViT的开发和测试
由Chen博士领导的数据科学团队首先使用了807名因疑似浸润性疾病或HCM而被转介到克利夫兰诊所俄亥俄州分院进行CMR的患者的回顾性数据分析来开发该模型。随后确诊的患者中,252名为心脏淀粉样变性,290名为HCM,265名为除淀粉样变性/HCM以外的心肌病(“其他”)。这些患者被按70/30的比例分为训练组和测试组。
另一组157名来自克利夫兰诊所佛罗里达州分院的患者用于外部验证。其中,51名患者被确诊为心脏淀粉样变性。
ViT模型通过数千张CMR图像进行训练,以识别心脏淀粉样变性,从而使模型“学会”寻找哪些特征。“CMR非常耗时,需要查看一千多张图像才能得出最终诊断,”Kwon博士解释说。“通常情况下,一个人需要30到40分钟来审查CMR图像并做出最终诊断,而这个推理工具只需大约17秒。”
在内部测试数据集(来自俄亥俄州)中,使用ViT模型诊断心脏淀粉样变性的准确率为84.1%,曲线下面积为0.954。在外部测试数据集(来自佛罗里达州)中,这些值分别为82.8%和0.957。
医生对诊断的信心水平也有所不同。当临床报告反映出中到高程度的医生信心时,ViT模型的准确率为90%,而报告不确定、缺失或错误诊断心脏淀粉样变性的情况下的准确率为61.1%。在后者的情况下,移除图像质量差、双病理或临床显著心脏淀粉样变性模糊的病例后,准确率提高到79.1%。
飞利浦制造的MRI扫描仪和西门子制造的MRI扫描仪之间的鉴别准确率相似(分别为83.9%和86.2%)。
被算法错误分类的患者左心室诊断质量较低(141克对163克;P=0.048)。然而,没有成像特征能够显著区分被ViT模型正确分类为HCM的患者与未被正确分类的患者。
有趣的是,ViT模型在俄亥俄州组的表现超过了临床医生,但在佛罗里达州组则不然,后者的人类读者比俄亥俄州组准确15%。Kwon博士认为,这一差异可能是因为佛罗里达州的患者在就诊时更常处于心脏淀粉样变性的晚期,因此表现出更多经典的CMR特征,提高了诊断信心和准确性。
最适合不确定情况
“这项研究说明了在实施AI工具时,如何仔细考虑转诊基础、就诊患者类型和读片医生的重要性,”Kwon博士说。她补充道,鉴于在佛罗里达州队列中,当医生高度自信时,准确率为84.7%,因此该工具应仅限于不确定情况。“当医生有信心时,它可能会将正确的答案变为错误的答案,比例为8%到15%,”Kwon博士说。“我对此感到担忧,因为我们不应该将正确的诊断变成错误的诊断。我的建议是,如果医生有信心,他们应该坚持自己的非AI辅助诊断评估。然而,如果他们不确定,这个AI工具可以提供额外的诊断指导。”
Hanna博士补充道,提供这一额外的诊断确定性水平非常重要。“正确诊断的重要性是首要的,”他说,“因为HCM和心脏淀粉样变性都有特定的疾病改变治疗方法。”
下一步计划
Kwon博士计划的下一步是在科学方法下探索这种实施策略。她将邀请专家同事审查本研究中的测试队列患者。她计划研究AI工具如何影响他们在接触AI工具前对原始诊断的信心水平。
她感谢克利夫兰诊所独特的多学科团队使这一努力成为可能。特别是,她提到了她的联合资深作者Chen博士,他开发了AI方法。“有一个现场的多学科专家团队至关重要,”Kwon博士指出。“在现场开发AI算法可以更深入地了解AI工具的优势和劣势,以及定制其部署。除非医生具有数据科学背景,否则他们无法独自开发和实施这一点。”
她补充说,技术尚未达到可以“即插即用”的阶段。“仍需大量工作来确定最佳的临床实施方法,这需要与数据科学和临床专家密切合作,”她总结道。“这是一个令人兴奋的时代。来自许多不同中心的快速发展将改变我们如何诊断和护理患者。”
(全文结束)

