医学诊断专家、医生助手和制图师——这些头衔都适用于贝克曼先进科学技术研究所研究人员开发的一种人工智能模型。
该新型模型能精准识别医学图像中的肿瘤和疾病,并被编程为通过可视化地图解释每次诊断。这一独特透明机制使医生能够轻松追踪其推理逻辑、复核准确性并向患者解释结果。
"我们的理念是帮助在疾病最早阶段捕捉癌症——就像地图上的X标记——并理解决策形成过程,"研究首席作者、贝克曼研究所研究生研究员苏里亚·森古普塔表示,"该模型将简化流程,为医生和患者提供便利。"
本研究已发表于《IEEE医学影像汇刊》。
猫狗与洋葱和食人魔
人工智能概念最早构想于1950年代,指计算机学习适应、分析和解决问题的能力。在ChatGPT等易用工具推动下,该技术如今已家喻户晓。
机器学习(ML)是研究人员创建人工智能系统的主要方法之一。ML对人工智能而言,如同驾驶员培训对15岁青少年:这是一个受控的监督环境,用于练习决策、适应新环境及在失误后重新规划路线。
深度学习——机器学习中更成熟复杂的分支——能处理海量信息以做出更精细决策。深度学习模型的决策能力源于目前最接近人脑的计算机模拟:深度神经网络。
这些网络如同人类、洋葱和食人魔一样具有分层结构,使其难以解析。网络的智力灌木丛越厚实、非线性越强,执行复杂人类任务的能力就越出色。
以训练区分猫狗图像的神经网络为例:模型通过学习每类图像并存储其特征(如体型、颜色和解剖结构)来识别。最终,模型会关注胡须特征,一见下垂舌头就判定为杜宾犬。
但深度神经网络并非万无一失。研究伊利诺伊大学厄巴纳-香槟分校电气与计算机工程系生物医学成像的森古普塔比喻道:"它们有时甚至多数时候判断正确,但未必基于正确原因。想必人人都认识那个见过一次棕色四足狗后,便认定所有棕色四足动物都是狗的孩子。"
森古普塔的困扰在于:若询问孩童决策依据,他们通常会解释;"但你无法质问深度神经网络如何得出答案,"他指出。
"黑箱"问题
尽管深度神经网络 sleek(流畅)、skilled(娴熟)且speedy(迅捷),却难以掌握高中微积分学生必备的核心技能:展示解题过程。这被称为人工智能"黑箱"问题,多年来令科学家困惑不已。
表面上看,追问将博美犬误判为猫的网络似乎无关紧要。但当涉及可能暗示乳腺癌早期征兆的乳腺X光片等改变生命的图像时,"黑箱"问题的严重性骤然提升。
全球不同地区解读医学图像的方式各异。"许多发展中国家医生稀缺而患者排长队,AI在此类场景大有可为,"森古普塔表示。
在时间与专业人才紧缺时,自动化医学图像筛查可作为辅助工具——绝非取代医生技能与经验。AI模型可预先扫描医学图像,标记含异常(如肿瘤或疾病早期标志物生物标志物)的图像供医生复核。此方法节省时间,甚至提升图像判读人员的工作效能。
这类模型效果良好,但当患者询问为何AI系统判定图像含(或不含)肿瘤时,其"医患沟通"能力明显不足。
历史上,研究人员借助多种外部解读工具试图破解"黑箱"。遗憾的是,使用者常面临类似偷听者困境:紧贴锁门,空杯贴耳却徒劳无功。
"若能直接推门而入亲耳聆听对话,将简便得多,"森古普塔比喻道。
更复杂的是,这些解读工具有众多变体,导致同一"黑箱"可能被"合理但不同"地诠释。森古普塔指出:"问题在于你该相信哪种诠释?选择可能受主观偏见影响,这正是传统方法的核心缺陷。"
森古普塔的解决方案?创造全新AI模型:每次自我解读——阐释每个决策而非机械报告"肿瘤/非肿瘤"二元结果。"换言之无需水杯偷听,因为门已消失,"他解释道。
绘制模型地图
瑜伽修行者需反复练习新体式;区分猫狗的AI模型需研习无数四足动物图像。
作为医生助手的AI模型则以数千张含异常与正常医学图像为"食粮"。面对新图像时,它快速分析并输出0至1之间的数值:低于0.5视为无肿瘤;高于0.5则需重点核查。
森古普塔的新模型在此基础上创新:同步生成决策值与解释性视觉地图。
该地图被研究者称为等效地图(E-map),本质是原始X光片、乳腺X光或其它医学图像的转换版本。如同数字填色画布,E-map每个区域被赋予数值:值越大,该区域对预测异常的医学意义越显著。模型累加区域值得出最终诊断依据。
"例如,若总和为1且地图含三个值——0.5、0.3和0.2——医生能清晰看出哪些区域贡献更大,从而重点核查,"森古普塔解释。
此方式使医生可复核深度神经网络工作效能——如同教师检查学生数学演算过程——并回应患者对诊断流程的疑问。
"最终构建起医生与患者间更透明、可信赖的系统,"森古普塔总结。
X标记位置
研究人员在三个疾病诊断任务中训练模型,涵盖超2万张图像:首先,模型学习标记乳腺X光片中肿瘤早期征兆;其次,分析视网膜OCT图像识别可能预示黄斑变性的玻璃膜疣;第三,研究胸部X光检测心肌肥大(可能导致疾病的心脏扩大状况)。
地图绘制模型训练完成后,研究人员将其性能与现有"黑箱"AI系统对比。新模型在三类任务中表现相当:乳腺X光片准确率77.8%,视网膜OCT图像99.1%,胸部X光83%,与现有系统77.8%、99.1%和83.33%持平。
高准确率源于深度神经网络——其非线性分层结构模拟了人类神经元的精细差异。
为构建此复杂系统,研究人员从线性神经网络汲取灵感(该网络更简单易解),"核心问题是:如何利用线性模型概念使非线性深度神经网络同样可解释?"项目负责人、贝克曼研究所研究员兼伊利诺伊大学生物工程系主任马克·阿纳斯塔西奥教授指出,"此项工作完美诠释了基础理念如何为前沿AI模型带来创新解决方案。"
研究团队期望未来模型能检测诊断全身各部位异常,甚至实现类型区分。"我欣喜于该工具对社会的直接效益——不仅提升疾病诊断水平,更强化医患信任与透明度,"阿纳斯塔西奥表示。
【全文结束】

