在RSNA24年度会议上,即北美放射学会(Radiological Society of North America)的年度大会,多位演讲者在12月2日和3日的多场会议中详细介绍了人工智能(AI)在放射学领域的重大进展。尽管进展过程非常复杂,但AI的采用确实在放射学这一医学专业中稳步推进。
今年的RSNA会议在芝加哥庞大的麦考密克展览中心举行,许多会议重点讨论了全国患者护理机构正在实施的实际创新。演讲者强调,当前似乎有无限的可能性,关键在于聚焦特定潜力领域,并有条不紊地推进。
在周二上午的一场题为“AI模型持续监控的最佳实践”的会议上,来自北卡罗来纳州格林斯伯勒的全国放射学家集团Radiology Partners的AI创新团队成员Walter F. Wiggins博士表示,成功的关键之一是在每个步骤验证流程。“我们在部署前会进行严格的五步临床验证过程,”Wiggins告诉听众。此外,他指出,“我们需要积极减轻人类-AI偏见。因此,我们教放射科医生这些工具如何工作,以及它们有时为何会失败。然后,在开发后,我们开发了一个持续监控系统,以应对性能随时间的漂移。”他还提到了《平价医疗法案》第1557节,该节将于明年要求患者护理机构证明他们正在采取措施对抗种族、民族、性别和年龄偏见。Wiggins指出,《平价医疗法案》第1557节的要求与之前的AI开发规定不同,因为这些要求需要患者护理机构领导采取行动,而不仅仅是供应商。
Wiggins强调,成功的关键是持续测试和评估,从预实施阶段到后实施阶段。他举了一个头部CT扫描的例子。他和他的同事已经实施了一个颅内出血检测工具。通过ChatGPT-4分析,该AI工具在检测结果上与放射科医生的发现匹配度达到了63.9%。然而,他们在检查患者年龄时发现,80岁及以上患者的匹配率为68.8%,50-79岁患者的匹配率为63.3%,18-49岁患者的匹配率仅为55.9%。他总结说,这一领域仍需大量工作。
当Wiggins和他的团队查看种族和族裔的数据变量时,情况变得更加复杂。他表示,“最大的问题是,在220万次头部CT检查中,有180万次涉及缺失的种族和族裔数据。数据稀疏且杂乱。这意味着对我们来说,关键在于改进数据收集。”
为什么AI开发对患者很重要?这个问题在周二下午的一场题为“利用大型语言模型改善以患者为中心的放射学:机遇与挑战”的会议上得到了强烈关注。弗吉尼亚大学放射学和医学影像学教授Arun Krishnaraj博士在会议开始时指出,“不幸的是,即使在21世纪,放射学报告看起来仍然像是20世纪的打字机打出来的。报告充满了术语和长长的列表。”他引用了埃里克·托波尔博士的书《患者现在见您》(The Patient Will See You Now),强调了提供者重新思考如何生成与患者护理相关的信息的必要性。
Krishnaraj展示了他的Epic MyChart记录中的信息,指出他的断指被标记为“XR Finger PA Lateral LT”。他坚持认为,“我们现在向患者开放了报告,但我们可以做得更好。”尽管大多数放射科医生都知道《21世纪治愈法案》(21st Century CURES Act)的重点是及时向患者发布信息,但他指出,“对于放射科医生来说,你们生成的报告对患者友好吗?可能不是。”
事实上,Krishnaraj提到,“我们进行了一项全国调查,评估放射科医生对《治愈法案》影响的熟悉程度。放射科医生是否改变了他们的做法?他们会做出改变吗?68%的受访者表示他们非常或某种程度上熟悉《治愈法案》。但44%的人对其中的规定持负面看法,而32%的人持正面看法。69%的人表示,《治愈法案》并未改变他们生成报告的方式、长度或内容。此外,68%的人更担心患者愤怒而不是理解。”同时,40%的放射科医生注意到患者沟通请求增加,31%的人注意到转诊医生要求修改报告的请求增加,例如纠正将“米”误用为“厘米”的错误——这是每位医生都能立即理解的错误,但患者可能不会。
Krishnaraj告诉听众,“2000年,《连线》杂志举办了一场比赛,询问如何使血液检查报告看起来更易读和美观。基于这一美学改进,我们查看了UVA的肺癌筛查报告,使其更易于患者接受。”他展示了患者友好的低剂量CT扫描报告图像,报告内容简洁易懂,配有大量有用的图表。他说,“这种沟通方式使我们的工作更加人性化,帮助患者理解。”Krishnaraj强调,“大型语言模型和定制GPT将允许您大规模生成患者可理解的信息。”
例如,Krishnaraj说,放射科医生将能够快速轻松地生成颈椎MRI(无对比剂)的患者友好版本报告。他引用了以下示例语言:“在你的颈部某部分,有一处骨刺和一个突出的椎间盘,它们对神经产生了压力。”这就是可以为患者创建的语言。
重要的是,他强调,“患者是关键利益相关者;他们不想等待。”他补充道,医患互动中的家长式作风正在消退,消费者主义正在上升。“这最终将导致共享决策,从而减少不必要的影像检查。生成式AI,结合大型语言模型,可以帮助我们实现这一目标。”
哈佛医学院放射学副教授Dania Daye博士在周二的会议上表示,大型语言模型在医学中的三大应用领域将是患者护理、研究和教育。Daye提到了广泛采用大型语言模型的局限性:“幻觉、偏见复制、错误信息传播和缺乏问责制。”她指出,“我想要发出警告:大型语言模型有很好的应用前景;然而,我们尚未达到理想状态。最大的担忧是幻觉。GPT可以产生幻觉并且表现得非常自信。我们的患者无法区分对错。ChatGPT主要基于互联网训练,目前还没有办法对GPT进行问责。”
尽管如此,Daye表示,大型语言模型在一系列临床操作目的中有着广阔的应用前景。“通常,”她说,“影像护理过程始于诊所某人输入订单。然后是决策、放射学申请、放射科医生制定协议,随后患者准备、进行影像检查,放射科医生准备并发布报告,最后报告被访问。大型语言模型可以在这一过程的每一步发挥作用。”
Daye引用了《放射学》杂志上的一篇文章,题为“基于上下文的聊天机器人超越放射科医生和通用ChatGPT遵循ACR适当性指南”,该研究表明聊天机器人提供了显著的时间和成本节省。她还引用了最近文献中的几项其他研究,包括2023年10月5日发表在《JAMA网络开放》上的《急诊科胸部X光片解读的生成式人工智能》,该研究发现GPT生成的报告与急诊科放射科医生相当,优于远程放射科医生。
这篇文章指出,“生成式人工智能方法可以根据用户指令生成文本和图像等数据,可能通过提供近乎即时的医学影像解释来弥补这一差距,支持高病例量而不受疲劳或人员限制的影响。生成方法相对于分类方法的一个重要优势是能够生成整个放射学报告,提供重要的决策背景。”
宾夕法尼亚大学的Tessa S. Cook博士接下来就“临床实施大型语言模型”进行了发言。作为心血管放射科医生,Cook表示,“我花了很多时间查看主动脉;每次打开病例,我都需要花十分钟寻找开单医生是谁,他们希望了解什么等。生成式AI在这方面可以提供很大帮助。”
Cook还分享了她对使用大型语言模型和生成式AI的“愿望清单”:
- 患者参与:患者可以就其健康和放射学护理提出问题,并立即获得通俗易懂的答案。
- 决策支持:大型语言模型可以为开单医生提供指导,帮助他们选择最有可能回答临床问题的检查。
- 智能影像:大型语言模型可以促进自动排程和制定协议,使患者在适当的地点以正确的方式接受正确的检查。
- 电子病历摘要:大型语言模型可以智能搜索和总结患者的病历和既往诊疗记录。
- 定制报告:大型语言模型可以将放射科医生的报告转换为患者可理解的版本,以及为全科医生和其他专科医生定制的版本。
Cook指出,“斯坦福大学的团队目前专注于临床文本摘要。他们使用各种不同的大型语言模型,有些是开源的,有些是专有的,应用于四种不同类型的文件:放射学报告、患者记录、进展笔记、患者健康问题、医患对话。他们尝试优化输出,进行各种定量评估,并将表现最佳的模型和方法交给人力资源部门评估。五位放射科医生和五位住院医师参与了这项临床读者研究。”她引用了一项最近的研究,医生被要求评估AI生成的摘要的正确性、完整性和简洁性。表现最佳的大型语言模型与人工摘要相当。“这里有很大的潜力,”她强调。
(全文结束)

