核心要点
- 哈佛研究人员开发了BrainIAC模型,该单一AI系统可灵活适配从阿尔茨海默病到癌症等多种脑部疾病的扫描分析,无需为每种疾病单独构建算法
- 该模型通过32000例无标签磁共振成像(MRI)扫描自主学习通用脑解剖结构,随后仅需每类别1至5个训练样本即可适应新医疗任务
- BrainIAC在七项不同挑战中达到优异性能,包括预测癌症生存期、检测基因突变及识别早期痴呆:这些任务单凭医生观察扫描图像难以完成甚至不可能实现
- 该方法有望加速罕见病AI工具开发,解决患者群体规模小、无法收集数千标记样本的难题
构建诊断脑部疾病的AI系统通常意味着每次都要从零开始。想检测阿尔茨海默病?需开发一个算法。脑肿瘤?另建一套系统。中风损伤?重新起步。如今,哈佛医学院研究人员证明存在更优解决方案。
他们训练出名为BrainIAC的单一AI模型,可灵活适配从早期痴呆识别到癌症生存期预测等任务。同一系统先通过数万例多病症MRI扫描学习通用脑解剖结构,随后仅用少量样本即可适应罕见儿科脑肿瘤分析。
这一突破解决了医疗AI的最大难题之一。医院存储着数百万脑部扫描数据,但多数无法用于AI训练——医生既无时间也无资金为每张图像标注。BrainIAC率先从无标签扫描中自主学习,掌握脑部结构模式。
教导AI识别脑部模式
以医学生为例。他们并非通过死记硬背单个疾病来学习放射学,而是先研究正常脑解剖结构,再学会识别异常。BrainIAC采用相同机制。
该模型在《自然神经科学》期刊发表的研究中,分析了十种不同病症患者及健康志愿者的32000多例脑部扫描。它自主掌握了捕捉脑结构、年龄相关变化、中风损伤模式及肿瘤解剖的内在表征:全程无需明确标签指导。
BrainIAC理解通用脑解剖后,研究人员仅需极少量额外训练即可将其适配新任务。他们在七项截然不同的医疗挑战中测试该模型:识别扫描类型、根据脑结构推测年龄、预测癌症患者生存期、检测脑肿瘤关键基因突变、识别早期痴呆、估算中风发生时间、勾勒肿瘤边界。
该模型处理了医生单凭MRI难以甚至无法完成的任务。预测肿瘤是否携带特定基因突变(通常需脑部手术和基因检测)的AUC值达0.79,这对仅靠观察扫描无法诊断的病症而言是显著成果。
首席研究员本杰明·坎恩博士发现,最大优势体现在训练数据稀缺的罕见病领域。仅用50个样本,BrainIAC在基因突变预测中AUC值达0.68,而从零训练的传统AI系统表现 barely优于随机猜测。
从极少量数据中学习
研究团队将测试推向极限:若每种扫描类型仅有一个样本呢?他们在面对影响全球仅数百名儿童的超罕见病时,使用荒谬稀少的数据集进行实验。
仅用四个训练样本,BrainIAC仍能比随机猜测更准确地区分四种扫描类型。对于最致命的脑癌之一胶质母细胞瘤,该模型预测患者能否存活一年以上。即使仅用10%训练数据,其一年生存期预测AUC值仍达0.62,而从零训练的系统表现 barely优于抛硬币。
这具有根本性意义。儿科脑癌可能全国每年仅影响50名儿童,根本无法收集万例标注训练样本。BrainIAC的方法使研究人员能为影响小规模患者群体的疾病开发AI工具,这在当今几乎不可能实现。
该模型甚至关注相关脑区。当研究人员可视化BrainIAC的聚焦区域时,发现其针对痴呆检测关注海马体(阿尔茨海默病中会萎缩的脑区)、针对衰老变化关注白质区域、针对癌症预测关注肿瘤核心。这些注意力图与已知神经解剖结构吻合,表明模型学习的是具有医学意义的特征而非任意模式。
此前未能成功的原因
当前医疗AI系统在脱离开发医院环境时往往惨败。麻省总医院开发的算法可能在德克萨斯州医院失效——MRI扫描仪不同、患者群体差异、甚至技术人员摆放患者姿势的微小变化都会影响效果。
坎恩团队通过在多机构扫描数据上训练BrainIAC,再测试其在完全不同的医院数据上的表现来验证。他们还故意用常见技术问题干扰图像:对比度偏移、模糊、强度变化。BrainIAC比从零训练或窄域预训练的替代模型更能应对噪声,尤其在其他模型性能崩溃的高难度预测任务中表现更优。
当前局限性
BrainIAC仅适用于标准结构MRI扫描——放射科医生每日查阅的基础序列。它无法处理显示脑活动的功能性MRI或专业扫描。更重要的是,这仍是研究阶段成果。团队分析了多年积累的扫描数据,但这不同于医生实时决策时的前瞻性测试。目前尚不清楚它能否实际改善患者预后、加速诊断或改变临床治疗决策。
更大图景
当前每个医疗AI项目都在重复造轮子。一个研究组花两年构建脑肿瘤检测器,另一个花两年开发阿尔茨海默病筛查工具,各自需要独立资金、数据收集和验证。
基础模型彻底改变这一现状。构建一个理解脑解剖的系统,再快速适配任何医疗问题。需要新发现疾病的工具?微调基础模型而非从零开始。年仅30例的罕见儿科癌症?基础模型提供关键起点。
该方法不会取代大型医疗中心为单一任务优化的专用AI系统。但它能显著降低为服务不足病症、罕见病及资源有限地区开发AI工具的门槛——在这些场景中收集海量训练数据根本不现实。
坎恩团队报告称模型和代码已公开供研究使用,这意味着其他研究者可在此基础上推进。无论BrainIAC本身是否广泛应用,其核心价值在于证明单一AI系统确实能跨阿尔茨海默病到脑癌的广泛脑成像任务实现灵活适配。
【全文结束】

