研究表明,人工智能(AI)在辅助诊断如子宫内膜异位症等疾病方面具有潜力,但如果模型不准确会发生什么?
阿德莱德大学罗宾逊研究所IMAGENDO团队的博士生Alison Deslandes最近的研究开始解决这一问题,她开发了一种用于评估妇科图像质量的评分系统,这些图像是由诊断用AI算法使用的。
“开发有价值的AI工具以协助超声诊断依赖于使用高质量的数据来开发算法,”Deslandes女士表示。
“先前的研究表明,当应用于低成本超声机器生成的低质量图像时,深度学习系统的性能会显著下降。
“我们有必要在探索使用AI算法诊断疾病的同时,创建评估图像质量的AI工具,以确保使用的信息是令人满意的。”
在文献综述后,研究人员开发了一种评分方法来评估经阴道超声(TVUS)的质量,六名专业人士对150张子宫和卵巢图像进行了评分,评分范围从1到4。
图像评估基于五个因素:解剖结构的正确描绘、视图中解剖结构的可见性、图像优化、图像用于诊断或病理解释的能力以及整体清晰度。
评分为4表示最佳质量图像,3表示次优图像,2表示低质量图像;评分为1表示图像被拒绝。
专业人士根据其领域进行配对,并要求他们一起检查图像(操作者间结果),以及在超过一周后再单独检查图像(观察者内结果)。
“我们发现,当我们的配对观察者查看图像时,图像质量的评分仅存在较差到中等的一致性;而当个体观察者在一周后再次查看图像时,一致性大多为弱到中等水平,”Deslandes女士说。
“评分系统的某些改进可能有助于提高一致性,但超声图像质量评估本身带有主观性,因此尚不清楚是否可以实现图像质量的量化。
“虽然一些AI系统可以容忍标签噪声,但大多数更倾向于干净(高质量)的数据。”
Deslandes女士表示,尽管AI系统可能会比人类更客观地评估图像质量(IQ),但这些系统的开发依赖于人类标注,而由于超声IQ固有的主观性,标注数据可能会包含噪声。
“因此,可靠的IQ评分方法对于进一步发展妇科超声AI系统至关重要,同时还需要能够适应噪声标注的AI方法,”Deslandes女士说。
(全文结束)

