加州大学洛杉矶分校的研究人员开发了一种使用 3D 生物医学成像数据来预测疾病风险因素的人工智能工具,根据最近发表在《自然·生物医学工程》上的一项研究。
加州大学洛杉矶分校的研究团队设计了这个被称为视觉转换器切片集成(SLIViT)的模型,使用人工神经网络来解决 3D 成像分析的人工智能模型开发中的一个常见障碍:缺乏大型数据集。
标准的 2D 医学图像显示长度和宽度,但 3D 图像增加了深度,可以对扫描捕获的器官或疾病有更深入的了解。然而,这些体积图像需要专家临床医生更多的技能、注意力和时间来解释——研究人员指出,例如,一次 3D 视网膜扫描可能由一百个 2D 图像组成。
这种成像方式需要专家仔细检查以发现潜在的细微疾病生物标志物,例如被扫描身体部位的肿胀体积。要在足够大的规模上进行这样的操作以创建强大的 3D 医学成像数据集用于人工智能训练,对研究人员来说是一个挑战。
研究的共同第一作者、加州大学洛杉矶分校计算医学的博士后研究员 Oren Avram 博士在新闻发布中解释说:“虽然有许多用于分析 2D 生物医学成像数据的人工智能方法,但用标准资源编译和注释标准 3D 模型所需的大型体积数据集以充分发挥人工智能的全部潜力是不可行的。有几个模型存在,但它们的训练工作通常集中在单一成像方式和特定器官或疾病上。”
SLIViT 通过对 2D 图像进行深度学习和预训练来克服这一点。
与加州大学洛杉矶分校萨缪利工程学院有关的博士生、共同第一作者 Berkin Durmus 说:“SLIViT 通过利用更容易获取的 2D 领域的先前‘医学知识’克服了训练数据集大小的瓶颈。”
该模型利用这些先前的知识,使用标记的、中等大小的数据集来预测疾病因素。通过将这些 3D 扫描预处理为 2D 图像并提取相关图像特征,该工具还可以在不同的医学成像技术中通用。
在测试时,SLIViT 在分析光学相干断层扫描、心脏超声视频、肝脏的 3D 磁共振成像扫描和胸部 3D 计算机断层扫描时,与临床专家的准确性相匹配。
Durmus 继续说:“我们表明,尽管 SLIViT 是一个通用模型,但与特定领域的最先进模型相比,始终能取得显著更好的性能。它具有临床应用潜力,与临床专家的手动专业知识的准确性相匹配,同时将时间减少了 5000 倍。与其他方法不同,SLIViT 足够灵活和强大,可以处理并非总是完美有序的临床数据集。”
研究团队进一步强调,该工具在现实条件下的高性能,使用的数据比可比的人工智能模型少,使其相对于传统的 3D 生物医学成像注释方法具有显著的潜在优势。
研究人员还指出,SLIViT 的效率可以提高诊断的及时性,降低数据采集成本,并加快医学研究。
加州大学洛杉矶分校的计算机科学和计算医学教授 Eran Halperin 博士说:“当确定一个新的疾病相关风险因素时,可能需要数月时间来培训专家在生物医学图像中大规模准确注释新因素。但是,有了一个相对较小的数据集,单个训练有素的临床医生可以在短短几天内进行注释,SLIViT 可以极大地加快许多其他未注释体积的注释过程,达到与临床专家相当的性能水平。”

