测试时数据增强提高共形预测效率Making AI models more trustworthy for high-stakes contexts, like classifying diseases in medical images

环球医讯 / AI与医疗健康来源:www.msn.com美国 - 英语2025-05-02 05:00:00 - 阅读时长4分钟 - 1744字
麻省理工学院的研究人员开发了一种简单而有效的方法,通过结合测试时数据增强(TTA)和共形分类,可以减少预测集的大小并提高预测的可靠性。这种方法在医学影像分析中具有潜在的应用价值,能够帮助医生更高效地诊断疾病。
医学影像疾病诊断人工智能共形分类测试时数据增强预测集大小诊断效率患者治疗准确性鲁棒性
测试时数据增强提高共形预测效率

医学影像中的模糊性对试图识别疾病的临床医生构成了重大挑战。例如,在胸部X光片中,胸腔积液(肺部异常积液)看起来非常像肺浸润(脓或血液的积聚)。

人工智能模型可以通过帮助识别细微细节并提高诊断过程的效率来辅助临床医生进行X光分析。但由于一张图像中可能存在许多可能的病症,临床医生可能希望考虑一组可能性,而不仅仅依赖一个人工智能的预测。

一种产生一组可能性的有前景的方法是共形分类,因为它可以方便地在现有的机器学习模型上实现。然而,它可能会产生不切实际的大规模预测集。

麻省理工学院的研究人员现在开发了一种简单而有效的改进方法,可以将预测集的大小减少多达30%,同时使预测更加可靠。

较小的预测集可以帮助临床医生更有效地确定正确的诊断,从而改善和简化患者的治疗。这种方法在各种分类任务中都很有用,比如在野生动物公园的图像中识别动物种类,因为它提供了更小但更准确的选择集。

“由于需要考虑的类别较少,预测集自然更具信息量,因为你是在少数选项之间进行选择。从某种意义上说,你并没有为了获得更多信息而在准确性上做出任何牺牲。”康奈尔科技博士后研究员Divya Shanmugam表示,她是在麻省理工学院研究生期间进行这项研究的。

Shanmugam与Helen Lu、前麻省理工学院博士后现Lilia Biosciences研究科学家Swami Sankaranarayanan以及高级作者、麻省理工学院计算机科学与人工智能实验室(CSAIL)成员、Dugald C. Jackson计算机科学与电气工程教授John Guttag共同撰写了这篇论文。该研究将在6月份的计算机视觉和模式识别会议上发表。

预测保证

部署用于高风险任务的人工智能助手,如在医学图像中分类疾病,通常设计为在每个预测中提供一个概率分数,以便用户可以评估模型的信心度。例如,模型可能会预测某个图像对应于特定诊断(如胸膜炎)的概率为20%。

但由于许多先前的研究表明这些概率可能不准确,因此很难信任模型的预测信心度。通过共形分类,模型的预测被替换为最可能的诊断集合,并且保证正确诊断在该集合中。

但由于人工智能预测的固有不确定性,模型经常会输出过于庞大的集合,以至于无法使用。

例如,如果模型正在将图像中的动物分类为10,000个潜在物种之一,它可能会输出包含200个预测的集合,以提供强有力的保证。

“对于某人来说,要从中筛选出正确的类别,这确实有很多类。”Shanmugam说。

这种技术也可能不可靠,因为输入的微小变化,如稍微旋转图像,可能会导致完全不同的预测集。

为了使共形分类更有用,研究人员应用了一种称为测试时数据增强(TTA)的技术,该技术旨在提高计算机视觉模型的准确性。TTA在一个数据集中创建单个图像的多个增强版本,可能通过裁剪图像、翻转图像、放大等操作。然后,它将计算机视觉模型应用于同一图像的每个版本,并聚合其预测。

“通过这种方式,你可以从单个示例中获得多个预测。这样聚合预测可以提高预测的准确性和鲁棒性。”Shanmugam解释道。

最大化准确性

为了应用TTA,研究人员保留了一些用于共形分类过程的标记图像数据。他们在这些保留的数据上学习如何聚合增强,自动增强图像以最大化基础模型预测的准确性。

然后,他们对模型的新TTA转换后的预测运行共形分类。共形分类器输出一个小得多的可能预测集,同时保持相同的置信度保证。

“将测试时数据增强与共形预测结合起来简单易行,在实践中有效,并且不需要重新训练模型。”Shanmugam说。

与之前的共形预测工作相比,他们的TTA增强方法在几个标准图像分类基准测试中减少了预测集的大小,从10%到30%不等。

重要的是,该技术在减少预测集大小的同时,保持了概率保证。

研究人员还发现,尽管他们牺牲了一些通常用于共形分类过程的标记数据,但TTA足以提高准确性,从而抵消失去这些数据的成本。

“这引发了关于模型训练后如何使用标记数据的有趣问题。标记数据在不同后训练步骤之间的分配是未来工作的一个重要方向。”Shanmugam说。

在未来,研究人员希望验证这种方法在文本分类模型中的有效性。为了进一步改进这项工作,研究人员还在考虑减少TTA所需计算量的方法。


(全文结束)

大健康

猜你喜欢

  • Ventana TROP2 RxDx 设备在非小细胞肺癌中获得FDA突破性设备认定Ventana TROP2 RxDx 设备在非小细胞肺癌中获得FDA突破性设备认定
  • 利用人工智能减轻护士负担的新尝试利用人工智能减轻护士负担的新尝试
  • 人工智能工具在孕前筛查心脏病的潜力人工智能工具在孕前筛查心脏病的潜力
  • 人工智能将进入医院和诊所人工智能将进入医院和诊所
  • 利用人工智能项目寻求更早诊断运动神经元病利用人工智能项目寻求更早诊断运动神经元病
  • 微软“AI for Good”资助项目受助者名单公布微软“AI for Good”资助项目受助者名单公布
  • 医院医生与败血症的隐秘较量医院医生与败血症的隐秘较量
  • 微软“AI for Good”拨款助力华盛顿州创新微软“AI for Good”拨款助力华盛顿州创新
  • 基于人工智能的模型通过数字病理图像准确分类儿童肉瘤基于人工智能的模型通过数字病理图像准确分类儿童肉瘤
  • 侵入性冠状动脉功能测试对ANOCA患者诊断血管运动功能障碍安全有效侵入性冠状动脉功能测试对ANOCA患者诊断血管运动功能障碍安全有效
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康