开发用于诊断脑部疾病的AI系统通常意味着每次都得从零开始。想要检测阿尔茨海默病?那就需要构建一个专用算法。脑肿瘤?再建另一个。中风损伤?重新开始。如今,哈佛医学院的研究人员证明存在更优方案。
他们训练了一个名为BrainIAC的单一AI模型,该模型可适应从早期痴呆识别到癌症生存预测等各项任务。同一系统首先通过数万例涵盖多种疾病的脑部磁共振成像扫描自主学习通用脑部解剖结构,随后仅需少量样本即可适应罕见的小儿脑肿瘤分析。
这项突破解决了医学AI领域最大的难题之一。医院存储着数百万份脑部扫描影像,但其中大多数无法用于AI训练——原因在于医生没有时间或资金为每张图像添加标注。BrainIAC首先从无标签扫描中学习,自主捕捉脑部解剖模式。
以医学生学习为例。他们并非通过逐个记忆疾病来掌握放射学知识,而是先学习正常脑部解剖结构,再学会识别异常。BrainIAC的工作原理与此相同。
该模型在《自然·神经科学》期刊发表的论文中进行了详细阐述,其分析了来自十种不同疾病患者及健康志愿者的32,000多份脑部扫描影像。它自主学习了捕捉脑部结构、年龄相关变化、中风损伤模式和肿瘤解剖特征的内部表征,全程无需明确标签指导。
在理解通用脑部解剖结构后,研究人员仅需极少量额外训练即可将BrainIAC适配至新任务。他们在七项完全不同的医疗挑战中进行了测试:识别扫描类型、通过脑结构推测年龄、预测癌症患者生存期、检测脑肿瘤中的关键基因突变、发现早期痴呆、估算中风发生时间以及勾画肿瘤边界。
该模型成功完成了医生单凭磁共振成像难以或无法实现的任务。例如,预测肿瘤是否携带特定基因突变(通常需脑部手术和基因检测)的AUC值达到约0.79,这对于仅凭影像无法诊断的情况已是显著成果。
首席研究员本杰明·坎恩博士发现,最大优势体现在训练数据稀缺的罕见疾病领域。仅用50个样本,BrainIAC在基因突变预测中就达到了约0.68的AUC值,而从零开始训练的传统AI系统表现 barely优于随机猜测。
研究团队将这种能力推向了极致。如果每种扫描类型仅有一个样本呢?他们在面对全球可能仅影响数百名儿童的超罕见疾病时,测试了这种极端小规模数据集。
即使总计仅有四个训练样本,BrainIAC仍能比随机猜测更准确地区分四种不同扫描类型。对于最致命的脑癌之一胶质母细胞瘤,该模型预测患者能否存活超过一年。即使仅使用10%的训练数据,其一年生存预测的AUC值仍达到约0.62,而从零训练的系统表现 barely优于抛硬币。
这具有简单而重要的现实意义:全美每年可能仅有50名儿童罹患某种小儿脑癌,根本无法收集10,000个标注训练样本。BrainIAC的方法使研究人员能够为影响小规模人群的疾病开发AI工具,而这种情况在当下基本不可能实现。
该模型甚至能关注相关脑区。当研究人员可视化BrainIAC的关注区域时,发现其针对痴呆检测聚焦海马体(阿尔茨海默病中会萎缩的脑区),针对衰老变化关注白质区域,针对癌症预测关注肿瘤核心。这些注意力图谱与已知神经解剖学特征一致,表明模型学习到了具有医学意义的特征,而非任意模式。
当前医疗AI系统在脱离原开发医院环境后往往表现严重失灵。在麻省总医院开发的算法可能在德克萨斯州的医院失效——原因包括MRI扫描仪差异、患者群体不同,甚至技术人员摆放患者姿势的细微差别。
坎恩团队通过在多机构扫描数据上训练BrainIAC,再测试其在完全不同医院数据上的表现来验证此问题。他们还故意用常见技术问题(对比度偏移、模糊、强度变化)干扰图像。BrainIAC比其他从零训练或窄域预训练的模型更能有效处理噪声,尤其在困难预测任务中,其他模型的性能会严重下降。
BrainIAC目前仅适用于放射科医生日常查看的标准结构磁共振成像序列,无法处理显示脑活动的功能性MRI或专业扫描。更重要的是,这仍处于研究阶段。团队分析了多年积累的扫描数据,但这与医生决策时AI实时运行的前瞻性测试不同。目前尚不清楚该模型是否能实际改善患者预后、加速诊断或改变临床实践中的治疗选择。
当前每个医疗AI项目都在重复造轮子。一个研究小组花费两年构建脑肿瘤检测器,另一个小组又花两年开发阿尔茨海默病筛查工具,各自需要独立的资金、数据收集和验证。
基础模型彻底改变了这一模式:构建一个理解脑部解剖的系统,然后快速适配到任何医疗问题。需要为新发现的疾病开发工具?微调基础模型而非从零开始。针对每年仅30例的罕见小儿癌症?基础模型为你提供良好起点。
这种方法不会取代大型医疗中心为单一任务优化的专用AI系统。但它能显著降低为服务不足疾病、罕见病和资源有限场景开发AI工具的门槛——在这些场景中收集海量训练数据并不现实。
坎恩团队报告称该模型和代码已公开供研究使用,意味着其他研究人员可在此基础上开展工作。无论BrainIAC本身是否被广泛采用,其核心价值在于证明单一AI系统确实能适应从阿尔茨海默病到脑癌的广泛脑部影像分析任务。
【全文结束】

