放射科医生开始使用基于AI的计算机视觉模型来加快解析医学扫描的繁琐过程。然而,这些模型需要大量精心标注的训练数据才能实现一致且准确的结果,这意味着放射科医生仍需花费大量时间标注医学图像。
由约翰霍普金斯大学布隆伯格杰出教授Alan Yuille领导的国际团队提出了一个解决方案:AbdomenAtlas,这是迄今为止最大的腹部CT数据集,包含来自全球145家医院的超过45,000个3D CT扫描,涵盖了142个标注的解剖结构——其规模是其最接近的竞争者TotalSegmentator V2的36倍以上。该数据集及其应用出现在最近一期的《Medical Image Analysis》杂志上。
关键要点
- 计算机科学家利用AI在不到两年的时间内创建了迄今为止最大的腹部器官数据集——如果仅靠人力完成这项任务将需要两千年。
- 该数据集将帮助世界各地的研究人员训练AI算法识别癌症和其他疾病,而不会给放射科医生带来过重负担。
以前的腹部器官数据集是由放射科医生手动识别和标注CT扫描中的各个器官,需要数千小时的人工劳动。
“标注45,000个CT扫描中的600万个解剖形状,要求一位专家放射科医生从公元前420年开始工作,才能在2025年完成这项任务,”主要作者、约翰霍普金斯大学怀廷工程学院计算机科学系助理研究员周宗伟说。
为应对这一巨大挑战,霍普金斯领导的团队使用AI算法大幅加速了器官标注任务。他们与12位专家放射科医生和额外的医学培训人员合作,在不到两年的时间内完成了本需人类单独工作两千年才能完成的项目。
研究人员的方法结合了三个在公共标注腹部扫描数据集上训练的AI模型,以预测未标注数据集的标注。使用颜色编码的注意力图突出需要改进的区域,该方法识别出模型预测中最关键的部分供放射科医生手动审查。通过重复这一过程——AI预测随后进行人工审查——他们显著加快了标注过程,实现了肿瘤标注速度提高10倍,器官标注速度提高500倍,研究人员表示。
图片说明:左侧为标准的腹部CT扫描切片系列,右侧为AbdomenAtlas的器官分割结果
图片来源:约翰霍普金斯大学
这种方法使团队能够在不增加放射科医生负担的情况下扩展数据集的范围、规模和精度,从而创建出迄今为止最大的完全标注的腹部器官数据集。他们继续添加更多扫描、器官以及真实和人工肿瘤,以帮助训练新的和现有的AI模型识别癌变生长、诊断疾病,甚至创建患者的真实数字孪生。
“通过让AI模型在数据有限的领域(如肿瘤识别)训练前学习更多相关解剖结构,我们已经使AI在某些肿瘤检测任务中表现得类似于平均放射科医生,”第一作者、计算机科学研究生李文轩报告说,他由Yuille指导。
AbdomenAtlas还作为一个基准,允许其他研究小组评估其医学分割算法的准确性。霍普金斯研究人员表示,用于测试这些算法的数据越多,它们在复杂临床场景中的可靠性和性能就能得到更好的保证。
该团队承诺最终将AbdomenAtlas公开发布,并提出新的医学分割挑战,例如去年10月在第27届国际医学图像计算和计算机辅助干预会议上举办的BodyMaps挑战赛。该挑战旨在鼓励不仅理论上表现良好,而且在临床环境中高效可靠的AI算法。
尽管AbdomenAtlas带来了许多进步,但其创建者指出,该数据集仅占美国每年获取的CT扫描的0.05%——并呼吁其他机构帮助填补空白。
“跨机构合作对于加速数据共享、标注和AI发展至关重要,”研究人员写道。“我们希望我们的AbdomenAtlas能够为更大规模的临床试验铺平道路,并为医学影像领域的从业者提供非凡的机会。”
(全文结束)

