保罗·博耶(Paul Boyer)是加利福尼亚州奥克兰凯撒医疗集团(Kaiser Permanente)的一名心理治疗师,他正亲身经历人工智能革命。他对这项技术并不太满意。
这家医疗巨头推出了由医疗AI先驱Abridge公司开发的一套新型记录软件,旨在以超快速度总结患者的就诊情况。对许多临床医生来说,这项技术缓解了他们生活中的一个长期困扰——行政和文书工作。
但对博耶和他的同事们来说,AI记录员造成了另一个困扰:它"不是特别有用"。他们最终不得不修正计算机生成的记录。
博耶表示,Abridge"不善于捕捉临床细微差别,也不善于捕捉情感语调",而这些在心理健康领域可能至关重要。例如,对于躁狂症患者,说话的方式比内容更重要,而该软件在捕捉这些线索方面存在困难。
记录软件不再是未来的浪潮;它已经是当下的现实。全美各地的医院都在实施这类软件。研究人员发现了一些益处。根据今年4月发表在《美国医学会杂志》上的一项对五家医院的研究,在安装一年后,使用这些产品最多的医生每天节省了超过半小时的工作时间。
许多医生喜欢在他们所在场所部署的这些产品——多项基于访谈的研究发现,医生们对这些记录软件的总体反应是积极的。
然而,正如博耶的例子所示,关于这些系统质量的问题依然存在。当博耶和他的同事们花时间修正记录时,安全研究人员担心临床医生可能不会认真检查错误。这意味着未来的医生可能会依赖错误信息。
Abridge表示,它会在部署的每个阶段评估其记录软件,包括与软件先前版本进行的头对头测试。
该公司应用科学总监戴维斯·梁(Davis Liang)在一份声明中告诉KFF健康新闻:"在模型部署后,我们监测临床医生的编辑、星级评分以及临床医生用户关于记录质量的自由文本反馈。"
人工智能记录软件是即将进入医疗保健领域的一系列AI工具的一部分。临床医生和患者安全倡导者表示,政府法规并未很好地构建起来,以防范新技术可能会遗漏或掩盖患者病情的重要细节,从而可能对患者造成伤害。
"目前在联邦层面没有'任何保障措施'来审查记录软件,"位于马里兰州哥伦比亚市的大型医院系统MedStar Health的人因因素研究专家拉杰·拉特瓦尼(Raj Ratwani)表示。人因因素即人们如何与技术互动。
拉特瓦尼担心,对健康软件的保障措施将进一步放松。他表示,负责监管电子健康记录(患者护理的中心记录)的国家卫生信息技术协调员办公室提出的规则可能会削弱对医疗记录易理解性、易用性和AI使用透明度的要求。而难以理解的记录可能会使临床医生感到困惑并导致错误。
从奥巴马政府开始,卫生与公众服务部(HHS)的IT办公室鼓励进行"以用户为中心的设计"测试,即开发人员在医生和护士身上测试他们的产品。监管机构还试图要求在蓬勃发展的AI工具市场中的公司提供更多透明度。
HHS部长小罗伯特·F·肯尼迪(Robert F. Kennedy Jr.)的健康IT办公室提出的规则中取消了这两项要求。
医生和其他医疗从业者查阅记录以获取临床信息,例如记录软件总结的患者护理历史以及患者使用的药物和疗法列表。医生还输入护理订单。
拉特瓦尼说,记录系统设计不良或混乱"可能会使药物列表变得如此复杂和令人困惑,以至于开处方的医生选择了错误的药物"。
Abridge的总法律顾问蒂姆·黄(Tim Hwang)表示,该公司"广泛支持"政府的规定,认为这是"必要的现代化",能够"适应AI快速发展的速度"。
"旧规则给电子健康记录系统带来了'过多的负担'",为数字健康公司提供咨询服务的Leavitt Partners公司的负责人瑞安·豪厄尔斯(Ryan Howells)说。Leavitt支持这些建议。
政府认为,取消要求将带来更多的创新和竞争。电子健康记录市场一直在整合,医院和其他临床医生选择的供应商越来越少。
2022年的一项研究发现,前两大供应商Epic和Oracle Health占据了医院市场70%以上的份额。豪厄尔斯认为,过多的规则给寻找良好记录系统的医疗机构带来了负担。他说,联邦法规是"阻碍真正临床创新的最大障碍"。
一些批评者认为,特朗普政府提议取消管理记录的要求过于宽泛。它移除了旨在保护记录安全的法规。它还消除了对敏感医疗数据的隐私保护,彻底改革了数据发送格式的标准等等。政府在其提案中写道,该规则可能使临床医生"通过增加竞争获得更多的健康IT选择来满足他们的需求"。
HHS的健康IT办公室拒绝发表评论,称该提案仍在监管流程中。公众评论已于2月结束。
但对一些人来说——甚至在医院和开发部门——最令人担忧的是提议取消确保新产品在实际用户上进行测试的先决条件,以及确保AI技术的决策对医生和护士透明的要求。
"历史上,医院和卫生系统一直受到某些AI工具'黑箱'性质以及算法如何开发的挑战,"美国医院协会的詹妮弗·霍洛曼(Jennifer Holloman)表示。随着更多AI工具涌入市场,该协会表示,透明度变得更加关键。
关于电子健康记录安全性的投诉由来已久,即使是看似简单的任务也是如此。拉特瓦尼喜欢用为特定疾病开药的例子。
"医生试图开泰诺(Tylenol),而药物列表可能如此混乱,以至于有30种不同剂量和用途的泰诺,而实际上这可以设计得更简单,让医生更容易选择他们真正要开的泰诺类型,"他说。
现实世界的用户测试旨在简化医生的记录设计。但Altera Digital Health(一家电子健康记录开发者)的政策和公共事务副总裁莉·伯切尔(Leigh Burchell)表示,政府以一种令人困惑的方式终止了这一要求。
在伯切尔对规则的解读中,规则提到了"执法自由裁量权",即政府可以选择不执行某些规则的原则,公司仍然需要进行测试——这部分工作很繁重——但不需要向联邦政府报告结果。
政府还在终止拜登时代创建AI透明度"模型卡片"的想法。其概念是,临床医生可以通过简单的鼠标点击来探索用于训练为其提供建议的AI工具的数据。但特朗普的监管机构表示,很少有人使用这个一年前推出的工具。
尽管如此,医院和医生对移除它表示担忧。美国医院协会在给HHS IT办公室的评论信中写道,该工具"提供了关于预测性或生成性AI应用程序如何设计、开发、测试、评估以及应如何使用的信息。这些数据对于建立对AI工具的信任和确保患者安全至关重要"。美国内科医师学会也发出了类似的警告,称"缺乏清晰度可能会削弱医生信任,增加责任费用,并损害医患关系"。
即使是开发者也不完全确定这个想法。伯切尔表示,她所在的电子健康记录行业协会对这个问题"有很多不同的观点"。"通常,我们在回应方面更加一致。"
不过,伯切尔的团队认为,公司应该对AI做出决策所依赖的数据以及它如何提出建议保持透明。
AI工具有效性的证据"稀少"或相互矛盾。
最近一项比较11种AI记录软件在退伍军人健康管理局试点中潜在用途的研究发现,在五个模拟场景中,该软件的表现不如人类。作者指出:"尽管环境AI记录员可以生成完整的记录,但总体质量仍普遍低于人类撰写的文档",而信息的遗漏尤其令人担忧,因为这可能会影响后续护理。
由于作者所说的"合同原因",退伍军人事务部研究中没有确定供应商。
而这只是AI工具的一种类型。一波又一波的工具正在到来,每种工具都需要自己的评估,更不用说已经安装的工具了。
博耶表示,目前他基本上可以忽略他的AI记录员。但他担心管理层会根据预期的时间节省来设计他的工作,并安排更多患者——这意味着他需要花更多时间与患者相处以及修正软件的错误。
凯撒医疗集团发言人文森特·斯托普(Vincent Staupe)表示,该公司不要求其临床医生使用AI。
博耶说:"当我修正那个记录时,我觉得这工作太多了。这肯定会变得更糟,而且占用了我本不应该花在修正AI工具上的时间。"
KFF健康新闻是一个全国性新闻编辑室,专门报道健康问题,也是KFF(凯泽家庭基金会)的核心运营项目之一——KFF是健康政策研究、民意调查和新闻报道的独立来源。
【全文结束】

