放射科医生开始使用基于人工智能的计算机视觉模型来加快解析医学扫描这一繁琐的过程。然而,这些模型需要大量精心标注的训练数据才能实现一致且准确的结果,这意味着放射科医生仍需花费大量时间标注医学图像。
由约翰霍普金斯大学布隆伯格杰出教授Alan Yuille领导的国际团队提出了一种解决方案:AbdomenAtlas,这是迄今为止最大的腹部CT数据集,包含来自全球145家医院的超过45,000个3D CT扫描图像,涵盖了142个标注的解剖结构——其规模比最近的竞争对手TotalSegmentator V2大36倍以上。该数据集及其应用成果发表在最近一期的《医学图像分析》杂志上。
计算机科学家利用AI在不到两年的时间内创建了这个庞大的腹部器官数据集,而仅靠人力完成这项任务则需要两千多年。该数据集将帮助世界各地的研究人员训练AI算法,以识别癌症和其他疾病,而不给放射科医生带来过重负担。
此前的腹部器官数据集是由放射科医生手动识别和标注CT扫描中的各个器官,需要数千小时的人工劳动。“标注45,000个CT扫描图像中的600万个解剖结构,需要一位专家放射科医生从公元前420年开始工作,才能在2025年完成这项任务。”主要作者、惠廷工程学院计算机科学系助理研究员Zongwei Zhou说。
为应对这一巨大挑战,霍普金斯大学领导的团队使用AI算法大幅加速了器官标注任务。他们与12位专家放射科医生及额外的医学培训人员合作,在不到两年的时间里完成了原本需要人类单独工作超过两千年的项目。
研究人员的方法结合了三个在公共标注腹部扫描数据集上训练的AI模型,以预测未标注数据集的标注。通过使用颜色编码的关注图突出需要改进的区域,该方法可以识别模型预测中最关键的部分,供放射科医生进行人工审核。通过重复这一过程——AI预测加人工审核——他们显著加速了标注过程,实现了肿瘤标注速度提高10倍,器官标注速度提高500倍。
这种方法使团队能够在不增加放射科医生负担的情况下扩展数据集的范围、规模和精度,从而创建出目前最大的完全标注腹部器官数据集。他们继续添加更多扫描图像、器官以及真实和虚拟肿瘤,以帮助训练新的和现有的AI模型识别癌变生长、诊断疾病,甚至创建现实患者的数字孪生体。
“通过让AI模型在数据有限的领域(如肿瘤识别)训练之前先学习相关解剖结构,我们使AI在某些肿瘤检测任务中表现得与平均放射科医生相似。”第一作者、计算机科学研究生Wenxuan Li表示,他由Yuille指导。
AbdomenAtlas还作为一个基准,允许其他研究组评估其医学分割算法的准确性。霍普金斯大学的研究人员表示,用于测试这些算法的数据越多,其在复杂临床场景中的可靠性和性能就能得到更好的保证。
尽管AbdomenAtlas带来了许多进步,但其创建者指出,该数据集仅占美国每年获得的CT扫描图像的0.05%,并呼吁其他机构帮助填补空白。“跨机构合作对于加速数据共享、标注和AI开发至关重要。我们希望AbdomenAtlas能为更大规模的临床试验铺平道路,并为医学影像界的从业者提供非凡的机会。”
(全文结束)

