哈佛医学院的研究人员开发了一种名为CHIEF(Clinical Histopathology Imaging Evaluation Foundation)的多功能AI模型,该模型可以执行多种诊断任务,涵盖各种类型的癌症,其性能优于现有的AI系统。经过数百万张图像的训练,该模型能够检测癌细胞、预测肿瘤的遗传特征,并准确预测患者的生存情况。
一种类似ChatGPT的模型可以诊断癌症,协助选择治疗方案,并预测多种癌症类型的生存结果
哈佛医学院的研究人员开发了一种类似于ChatGPT的多功能AI模型,该模型可以在多种类型的癌症中执行广泛的诊断任务。这项新AI系统于9月4日在《自然》杂志上进行了描述。研究人员认为,这种新模型超越了许多当前的癌症诊断AI方法。
目前的AI系统通常被训练执行特定任务,例如检测癌症的存在或预测肿瘤的遗传特征,并且它们通常只适用于少数几种癌症类型。相比之下,新模型可以执行广泛的任务,并在19种癌症类型中进行了测试,显示出与大型语言模型(如ChatGPT)类似的灵活性。
“我们的目标是创建一个灵活、多功能的类似ChatGPT的AI平台,能够执行广泛的癌症评估任务,”研究高级作者、哈佛医学院布拉瓦尼克研究所生物医学信息学助理教授Kun-Hsing Yu说。“我们的模型在多种癌症的检测、预后和治疗反应相关任务中表现出色。”
该AI模型通过读取肿瘤组织的数字切片来检测癌细胞,并基于图像中看到的细胞特征预测肿瘤的分子谱,其准确性高于大多数当前的AI系统。它可以预测多种癌症类型的患者生存情况,并准确指出与患者对标准治疗(包括手术、化疗、放疗和免疫疗法)反应相关的肿瘤微环境特征。此外,该工具还能够生成新的见解,例如,它识别出某些先前未知与患者生存相关的肿瘤特征。
研究团队表示,这些发现进一步证明了AI驱动的方法可以提高临床医生高效准确地评估癌症的能力,包括识别可能对标准癌症治疗反应不佳的患者。
“如果进一步验证并广泛部署,我们的方法及其类似方法可以及早识别出可能受益于针对特定分子变异的实验性治疗的癌症患者,这是全球范围内尚未普遍可用的能力,”Yu说。
训练与性能
这项最新工作建立在Yu之前关于AI系统评估结肠癌和脑肿瘤的研究基础上。这些早期研究证明了该方法在特定癌症类型和特定任务中的可行性。
新模型CHIEF接受了1500万张未标注图像的训练,这些图像被分割成感兴趣的区域。然后,该工具进一步在60,000张全切片图像上进行了训练,这些图像涵盖了肺、乳腺、前列腺、结直肠、胃、食道、肾、脑、肝、甲状腺、胰腺、宫颈、子宫、卵巢、睾丸、皮肤、软组织、肾上腺和膀胱等组织。通过对特定区域和整张图像进行训练,该模型能够将特定区域的变化与整体背景联系起来。研究人员表示,这种方法使CHIEF能够更全面地解释图像,而不仅仅是关注某个特定区域。
训练完成后,研究团队在来自全球24家医院和患者队列的32个独立数据集中,对19,400多张全切片图像进行了CHIEF性能测试。总体而言,CHIEF在以下任务中比其他最先进的AI方法高出36%:癌细胞检测、肿瘤起源识别、预测患者预后和识别与治疗反应相关的基因和DNA模式。由于其多功能训练,CHIEF无论肿瘤细胞是通过活检还是手术切除获得,表现同样出色。而且,无论用于数字化癌细胞样本的技术如何,其准确性也一样高。这种适应性使其能够在不同的临床环境中使用,代表了当前模型的重要进步,后者通常只有在读取通过特定技术获得的组织时才能表现良好。
癌症检测
CHIEF在癌症检测方面的准确率达到近94%,并在包含11种癌症类型的15个数据集中显著优于当前的AI方法。在从独立队列收集的五个活检数据集中,CHIEF在包括食道、胃、结肠和前列腺在内的多种癌症类型中达到了96%的准确率。当研究人员在以前未见过的结肠、肺、乳腺、子宫内膜和宫颈手术切除肿瘤切片上测试CHIEF时,该模型的表现准确率超过90%。
预测肿瘤的分子谱
肿瘤的遗传组成对于确定其未来行为和最佳治疗方法至关重要。为了获取这些信息,肿瘤学家会订购肿瘤样本的DNA测序,但由于成本和时间问题,这种详细的基因组分析在全球范围内并不常规进行。即使在资源丰富的地区,这一过程也可能需要几周时间。AI可以填补这一空白,Yu表示。
快速识别图像中暗示特定基因组异常的细胞模式,可以提供一种快速且经济的替代基因组测序的方法,研究人员表示。
CHIEF在预测肿瘤基因组变异方面优于当前的AI方法。这种新的AI方法成功识别了与癌症生长和抑制相关的几个重要基因的特征,并预测了与肿瘤对各种标准疗法反应相关的关键基因突变。CHIEF还检测到与结肠肿瘤对免疫检查点阻断免疫疗法反应相关的特定DNA模式。在查看整个组织图像时,CHIEF在54个常见突变癌症基因中识别突变的总体准确率超过70%,优于当前最先进的基因组癌症预测AI方法。其在特定癌症类型中特定基因的准确性更高。
研究团队还测试了CHIEF预测与FDA批准的靶向疗法反应相关的18个基因中15个解剖部位突变的能力。CHIEF在多种癌症类型中达到了高准确率,包括在检测弥漫性大B细胞淋巴瘤中常见的EZH2基因突变时达到96%的准确率,甲状腺癌中BRAF基因突变的准确率为89%,头颈部癌症中NTRK1基因突变的准确率为91%。
预测患者生存
CHIEF成功地基于初始诊断时获得的肿瘤病理图像预测了患者生存。在所有癌症类型和所有患者群体中,CHIEF区分了长期生存和短期生存的患者。CHIEF的性能比其他模型高出8%。在晚期癌症患者中,CHIEF比其他AI模型高出10%。总体而言,CHIEF在17个不同机构的患者样本中预测高死亡风险与低死亡风险的能力得到了测试和确认。
提取关于肿瘤行为的新见解
该模型识别了与肿瘤侵袭性和患者生存相关的图像特征。为了可视化这些感兴趣区域,CHIEF生成了图像上的热图。当人类病理学家分析这些AI生成的热点时,他们看到了反映癌细胞与周围组织相互作用的有趣信号。其中一个特征是在长期生存者的肿瘤区域中免疫细胞数量较多,这表明免疫系统可能已被激活攻击肿瘤。
在短期生存者的肿瘤中,CHIEF识别出了一些特征,包括细胞各部分之间的异常大小比例、细胞核的更多不典型特征、细胞间的弱连接以及肿瘤周围较少的结缔组织。这些肿瘤周围也有更多的死亡细胞。例如,在乳腺肿瘤中,CHIEF指出了组织内部的坏死或细胞死亡。相反,生存率较高的乳腺癌更有可能保留类似于健康组织的细胞结构。研究团队指出,与生存相关的视觉特征和感兴趣区域因癌症类型而异。
下一步计划
研究人员表示,他们计划通过以下方式改进CHIEF的性能并增强其功能:
- 对罕见疾病和非癌症状况的组织图像进行额外训练
- 包括来自癌前组织的样本,这些组织在细胞完全癌变之前
- 暴露模型更多的分子数据,以增强其识别不同侵袭性水平癌症的能力
- 训练模型预测新型癌症治疗的益处和不良反应,而不仅仅是标准治疗
参考文献:Xiyue Wang, Junhan Zhao, Eliana Marostica, Wei Yuan, Jietian Jin, Jiayu Zhang, Ruijiang Li, Hongping Tang, Kanran Wang, Yu Li, Fang Wang, Yulong Peng, Junyou Zhu, Jing Zhang, Christopher R. Jackson, Jun Zhang, Deborah Dillon, Nancy U. Lin, Lynette Sholl, Thomas Denize, David Meredith, Keith L. Ligon, Sabina Signoretti, Shuji Ogino, Jeffrey A. Golden, MacLean P. Nasrallah, Xiao Han, Sen Yang 和 Kun-Hsing Yu,《一种用于癌症诊断和预后预测的病理基础模型》,《自然》,2024年9月4日,DOI: 10.1038/s41586-024-07894-z
这项研究部分得到了美国国立卫生研究院普通医学科学研究所R35GM142879拨款、国防部同行评审癌症研究计划职业发展奖HT9425-23-1-0523、谷歌研究学者奖、哈佛医学院院长创新奖和Blavatnik计算生物医学中心奖的支持。
Yu是美国专利16/179,101的发明人,该专利归哈佛大学所有,并担任Takeda、Curatio DL和Postgraduate Institute for Medicine的顾问。Jun Zhang和Han曾是腾讯AI实验室的员工。
(全文结束)

