没有什么比人工智能(AI)及其广泛应用更能吸引当今媒体的关注了。在医学影像领域,新兴的人工智能技术和软件正在显著提高生产力。然而,将这些功能整合到医学成像系统及临床环境中也带来了独特的风险。那么,这种范式对医学影像的未来意味着什么?一位精通技术的健康信息技术(Health IT)或医疗技术管理(HTM)领导者在与临床医生讨论采用这项技术时需要了解哪些内容?
对于医学影像而言,人工智能的集成可以实现快速读取和分析医学图像。目前市场上设备的AI功能通过接收患者的扫描结果并利用多层卷积神经网络运行深度学习算法来处理这些数据。这些算法提取出定义解剖结构和潜在异常的特征,每个特征由网络中的不同层提取。基于这些特征,系统会将图像分类为受特定疾病影响或未受影响。此外,许多系统还会提供受影响区域的热图以及诊断结果的概率。
使用机器学习(ML)或AI算法处理X射线、CT扫描或MRI扫描以检测图像中指定的异常,相比手动读取每张图像,可为技术人员节省大量时间。但这些系统的检测能力究竟有多可靠呢?针对医学影像中AI模型的验证显示出高灵敏度(即能够检测更细微的异常,从而实现早期诊断),有时甚至高于人工判读。然而,这种灵敏度是否直接转化为临床使用和安全性?
如何弥合AI模型预测结果与最佳诊断、干预和治疗之间的差距,是将AI应用于医学领域面临的最突出挑战之一。
这些模型的应用通常被预期可以减少放射科医生日益增加的工作量,并解决人员配备问题。此外,它们的高灵敏度意味着更多的早期疾病检测,结合及时的干预措施,这可能挽救生命。这或许是AI在医疗领域积极影响的巅峰。
但根据机器学习的本质,即使是技术上最复杂且经过精心设计的算法,其智能水平也仅限于输入的数据质量。人们开始担忧用于训练这些迅速涌现工具的数据准确性。同时,也有必要质疑所用数据集的规模、广度和深度。这些数据是否涵盖了所有疾病案例?它们是否考虑到不同患者群体中疾病的多样表现?如果没有,任何算法能否自信地提供建议诊断?
生成对抗网络(GANs)是一类生成新合成数据的机器学习模型。在本例中,它们创建合成医学图像。研究人员在适用数据有限的情况下可能会使用GANs生成训练数据。换句话说,医学影像的AI功能现在可能基于合成医学图像开发。
训练数据验证是另一个引发关注的主要挑战,尤其是在考虑AI临床使用的准确性和安全性时。
图像分类只是ML技术在临床环境中的一个应用,但这些模型正在市场上迅速普及。FDA已经批准了数千种利用AI的医疗设备。然而,这些系统仅使用锁定算法,这意味着算法的训练在实施之前完成,并保持不变,直到新版本发布。FDA继续确保AI赋能医疗设备的安全性。
随着AI分类模型不断进入临床环境,对特定标准的需求也随之产生。AAMI TIR34971:2023是第一份涉及带有人工智能和机器学习组件的医疗设备风险管理的文件。该指南本质上描述了如何将ISO 14971应用于具有AI和ML功能的设备。ISO 14971更广泛地定义了医疗设备的风险管理,包括软件和网络安全风险。
ISO/IEC 5259-2:2024概述了一个框架,用于管理支持数据决策模型(特别是AI和ML模型)的训练数据质量。然而,它并未具体针对医疗设备或AI在临床环境中的使用。
总体而言,AI在提高诊断准确性、减轻工作负担以及增加早期疾病检测方面的潜力是开创性的。然而,其对训练数据的依赖以及尚未完全具备临床可行性,引发了关于安全性、可靠性和伦理影响的关键问题。鉴于这些问题,AI在医学影像的未来不仅取决于其能力,还取决于所采取的技术和伦理保障措施,以确保其安全有效地服务于患者和医务人员。因此,专业人士必须在进步与谨慎之间找到独特的平衡。
(全文结束)

