研究人员在《甲状腺》杂志上发表的一封致编辑信中表示,一种基于分析超声图像和分子检测结果的人工智能(AI)模型可能有助于医疗专业人员治疗不确定的甲状腺结节。
研究团队创建了一个注意力-多实例深度学习AI模型,用于预测不确定甲状腺结节是良性还是恶性。在创建了一个与之前研究中报告的模型性能相当的基线模型后,研究人员进行了调整,并最终创建了一个集成模型,显著改进了基线模型。
“通过将分子检测报告中的可疑评分与诊断超声检查中的特征相结合,我们能够提高这些评分。”加利福尼亚大学洛杉矶分校放射学、生物工程和医学信息学助理教授、生物医学AI研究实验室副主任William Speier博士告诉Healio。“由于过度治疗是甲状腺癌管理中的一个重大问题,我们的目标是在不漏诊恶性肿瘤的情况下避免假阳性。我们调整了模型以匹配临床敏感性,并发现能够将假阳性率降低11.5%。”
Speier及其同事收集了2016年5月至2022年2月期间在UCLA医学中心就诊的不确定甲状腺结节患者的数据。初始模型结合了超声成像、分子检测结果和Bethesda分类。该模型的目标是减少不确定甲状腺结节中的假阳性。
在333名患者中,259名患者患有良性甲状腺结节(中位年龄56岁;男性占19.1%),74名患者患有恶性结节(中位年龄47岁;男性占21.1%)。在恶性结节患者中,47%患有乳头状甲状腺癌,35%患有非侵袭性滤泡型甲状腺肿瘤伴乳头状核特征,15%患有滤泡型甲状腺癌。
基线AI模型的受试者工作特征曲线下面积(AUROC)为0.728,灵敏度为0.946,特异性为0.664。基线模型的阳性预测值为0.448。研究人员写道,基线模型的AUROC与其他先前研究中的模型一致。
“我们惊讶地发现,包括活检中的Bethesda评分并没有改善诊断结果。”Speier说,“我们原本预期这个评分会对我们的AI模型有所帮助,因为已发表的研究显示Bethesda III和Bethesda IV活检之间的恶性率存在差异。然而,单独使用或与影像学或分子检测结合使用时,包含这一信息并未产生显著结果。”
研究人员测试了进一步排除Bethesda分类的模型。在最终的集成模型中,AUROC上升到0.831,特异性增加到0.703(P = .0008),而灵敏度与基线模型相同。最终模型的阳性预测值略微增加到0.477。
“这种算法可以为医生在对不确定结节进行分子检测后选择治疗方法提供指导。”Speier说,“该模型可以识别出分子检测结果可疑但没有恶性的患者。这一知识可以帮助医生选择更温和的治疗方法,而不增加漏诊癌症的风险。”
尽管这些发现很有前景,但仍需要一项使用多个中心数据的更大规模研究来验证该模型。研究人员正在继续改进模型,并寻求纳入更多数据。
“我们正在努力扩展我们的模型,以包括更多的信息和模式,包括放射学和病理报告、数字化细胞病理切片以及分子检测报告中的具体突变信息。”Speier说。
(全文结束)

