自动化医疗文书(也称为AI医疗文书、AI文书、环境语音技术(AVT)、数字文书、虚拟文书和环境AI文书)是能够转录医疗语音的工具,例如患者咨询和口述临床记录。这些工具还能生成咨询摘要,旨在减轻临床医生的行政负担并提高文档处理效率。基于大型语言模型(LLMs,通常称为"AI",即"人工智能"的缩写)的自动化医疗文书在2024年变得越来越流行。
自动化医疗文书的隐私保护措施差异很大。虽然可以在本地完成所有转录和摘要工作而不连接互联网,但大多数闭源提供商要求将数据发送到他们自己的服务器,经过安全处理后再将结果传回。一些零售商使用零知识加密(意味着服务提供商无法访问数据)。部分AI文书不会使用患者数据来训练其AI,也不会将数据出租或转售给第三方。与此同时,很少有提供商在学术期刊上发表过安全性或实用性数据,也很少有提供商会对研究其产品的医学研究人员的请求作出回应。
隐私
一些提供商对用户数据的处理方式表述不清。有些可能会将数据出售给第三方。有些明确将用户数据发送给营利性科技公司用于二次用途,而这些用途可能并未明确说明。有些要求用户签署同意书,允许对其数据进行此类再利用。有些将用户数据用于训练软件,承诺会对其进行匿名化处理;然而,去匿名化可能是可行的(即可能变得明显知道患者是谁)。本质上,无法阻止大型语言模型关联其输入数据;它们的工作原理是在非常大的数据集中寻找相似的模式。从其他来源可以获取有关患者的一些信息(例如,新闻媒体报道中可能包含他们在某一天受伤的信息;他们的手机提供商/应用程序/数据经纪人的记录中可能包含他们在特定时间参加了特定预约地点的信息;他们的在线购物记录可能暗示了他们何时生了孩子;他们可能会向医生和论坛或博客提及生活方式的改变)。软件可能会将此类信息与"匿名化"的临床咨询记录相关联,并在被问及特定患者时,提供他们只私下告诉医生的信息。由于患者的记录都是关于同一患者的,因此它们不可避免地相互关联;在很多情况下,医疗历史本质上是可识别的。根据病情的普遍程度和其他可用数据,K-匿名性可能毫无用处。理论上,差分隐私可以保护隐私。
像谷歌、亚马逊和微软这样的数据经纪公司已经生产或收购了医疗文书,其中一些将用户数据用于二次用途,这引发了反垄断担忧。过去,将患者记录用于AI训练曾引发法律诉讼。
开源程序通常在医生自己的计算机上完成所有转录工作。开源软件在医疗保健中被广泛使用,一些国家的公共医疗机构会举办"黑客日"活动。
数据转售和商业化
多家自动化医疗文书提供商在其服务协议中包含允许重新使用、出售或商业化匿名化或用户提交数据的条款。尽管这些数据通常被描述为匿名化或聚合的,但这些做法引发了临床医生和隐私倡导者对医疗信息二次使用的伦理担忧。
- Freed(一个AI转录和文书平台)在其使用条款中声明,它可能"收集、使用、发布、传播、出售、转让以及以其他方式利用"从用户输入中得出的匿名化和聚合数据。
- OpenEvidence也表示,它可能"收集、使用、转让、出售,并出于任何目的(包括商业用途)披露非个人信息和客户使用数据"。
- Doximity(在其医生平台中提供AI医疗文书)授予自己"非独占的、不可撤销的、全球性的、永久的、无限的、可转让的、可再许可的、免版税的"许可,以"复制、准备衍生作品、改进、分发、发布、...分析、索引、标记以及商业化"用户提交的内容,但需遵守其隐私政策。
由于这些条款允许广泛的二次使用——包括销售、许可、模型训练、衍生作品以及对匿名化或用户提交数据的商业利用——一些评论家建议,临床医生在采用AI文书工具时,尤其是在患者隐私和法规合规性至关重要的临床环境中,应仔细审查数据处理条款。
加密
对数据的多因素身份验证是预期的实践。
通常,Diffie-Hellman密钥交换用于加密;这是在线银行等常用的标准方法。这种加密虽然成本高昂但并非无法破解;通常不被认为能抵御拥有国家资源的窃听者。
如果内容在客户端和服务提供商的远程服务器之间加密(传输加密),则服务器拥有未加密的副本。如果数据被服务提供商使用(例如,用于训练软件),则这是必要的。零知识加密意味着唯一的未加密副本在客户端,服务器无法比中间人攻击者更容易解密数据。
平台
文书可以在各种操作系统的台式机、笔记本电脑或移动计算机上运行。这些平台的风险各不相同;例如,移动设备可能会丢失。底层的移动或桌面操作系统也是可信计算基础的一部分,如果它们不安全,依赖它们的软件也无法安全。
虚构、遗漏和其他错误
与其他大型语言模型一样,医疗文书大型语言模型容易出现虚构现象,即它们基于训练数据和转录音频之间的统计关联来编造内容。大型语言模型无法区分尝试转录音频和猜测接下来会出现什么词语,而是将这两个过程混合在一起。它们特别可能将短暂的沉默或非语音噪音解释为某种语音并进行转录。
AI医疗文书曾被发现虚构种族主义和其他偏见内容;这部分是因为许多大型语言模型的训练数据集包含关于医疗种族主义的伪科学文本。它们可能会错误地标识患者的性别。一项调查显示,大多数医生原则上更希望文书经过医学主题专家审查的数据进行训练。相关、准确的训练数据增加了准确转录的可能性,但并不能保证准确性。在数千次真实临床对话上训练的软件生成的转录错误率较低。使用人工转录训练数据训练的软件比使用自动转录训练数据(如YouTube字幕)训练的软件表现更好。
自动文书会将对话类别中认为无关的部分省略。它们可能错误地将相关信息归类为无关并将其省略。它们还可能混淆历史症状和当前症状,或以其他方式错误分类信息。它们也可能简单地错误转录语音,写出不正确的内容。如果临床医生不仔细检查录音,这些错误可能会进入他们的医疗记录并造成患者伤害。
患者同意
专业组织通常要求只有在获得患者同意的情况下才能使用文书;某些机构可能要求书面同意。医护人员还必须遵守当地监控法律,这些法律可能将未经同意录制私人对话定为犯罪。应提供有关数据如何加密、传输、存储和销毁的完整信息。在某些司法管辖区,将数据传输到任何没有同等隐私法律的国家,或在那里处理或存储数据是非法的;无法保证其产品不会非法将数据发送到国外的供应商不能合法使用。
一些供应商收集数据用于再利用或转售。医疗专业人员通常被认为有责任审查用户协议的条款和条件,并识别此类数据再利用。一般医疗机构通常需要向患者提供有关二次使用的信息,允许他们选择退出二次使用,并获得每次特定二次使用的同意。数据只能用于约定的目的。
技术和市场
截至2024年,医疗文书市场高度竞争,市场上有50多种产品。其中许多产品只是围绕相同大型语言模型后端的专有包装,包括其设计者警告不应将其用于医疗等关键应用的后端。一些供应商针对特定医学分支销售专业化的文书(尽管大多数针对全科医生,他们约占医生的三分之一)。越来越多的供应商将其产品营销为不仅仅是文书,声称它们是医生的智能助手和副驾驶。这些更广泛的用途引发了更多的准确性担忧。例如,从对话中提取信息以自动填充表格可能会出现问题,症状可能被错误地标记为"不存在",即使它们被反复讨论。模型未能提取许多对症状的间接描述,例如患者说他们只能睡四个小时(而不是使用"失眠"一词)。
大型语言模型并不是被训练来生成事实,而是生成看起来像事实的内容。使用模板和规则可以使它们在提取语义信息方面更加可靠,但"虚构"或"幻觉"(看似可信但错误的输出)是该技术的固有部分。
定价
除了完全开源的程序(免费)外,医疗文书计算机程序都是租用而非出售的("软件即服务")。月费从几十美元到几千美元不等。一些公司采用免费增值模式,每月提供一定数量的免费转录。
那些整合到电子健康记录中、无需复制粘贴的文书通常价格更高。
完全开源的文书免费提供软件。用户可以在自己选择的硬件上安装,或付费让他人安装。一些开源文书可以安装在本地设备(即录制音频的设备)上,或安装在本地服务器上(例如,为单个诊所服务的服务器)。它们通常可以设置为不向外部发送任何信息,实际上可以在没有互联网连接的情况下使用。
医疗保健中的影响
AI医疗文书正在通过直接解决临床医生面临的最紧迫挑战——尤其是导致职业倦怠的行政负担——来变革医疗保健行业。
减少临床医生倦怠
AI文书最显著的影响之一是能够减轻医疗专业人员面临的压倒性文档工作负担。通过自动转录和总结咨询内容,AI文书释放了临床医生原本会花在行政任务上的宝贵时间。研究表明,普通临床医生将其工作日的很大一部分花在文档上,导致疲劳和减少与患者的互动。例如,在英国最大规模的环境AI临床推广中,五分之四使用该工具的全科医生表示它节省了他们的时间,同样数量的医生报告说它使他们能够与患者建立更好的关系。
通过自动化这些重复性任务,AI文书为临床医生创造了更健康的工作与生活平衡,使他们能够专注于患者护理并减少下班后的记录工作。这种行政负担的减少直接导致压力和倦怠水平降低,这一问题近年来在医疗环境中日益严重。能够将例行文档任务卸下,有助于临床医生重新获得他们的时间和精力,从而提高整体工作满意度。
提高工作满意度
除了减少倦怠外,AI文书还通过让临床医生专注于他们认为最有意义的工作方面——患者互动和临床决策——来提高他们的工作满意度。临床医生报告说,由于在咨询期间不再需要不断打字或口述笔记,他们感觉更能专注于患者。这种转变促进了与患者更有意义的对话,提高了所提供的护理质量。通过简化工作流程并使文档更高效,AI文书还使医疗保健工作者能够承担更多有意义的任务,并在工作中培养更大的目标感。
改善医疗保健工作者条件
AI文书的兴起是AI和自动化被整合到医疗保健中以改善工作者条件的更广泛趋势的一部分。AI的角色不仅仅是替代人力,而是通过让临床医生专注于其工作的核心要素——提供护理、与患者互动和做出关键医疗决策——来支持他们。随着AI帮助管理文档负担,临床医生不太可能经历在医疗环境中普遍存在的高水平倦怠和工作不满。因此,AI文书是医疗保健未来的关键组成部分,支持临床医生的心理健康,并促进更可持续的医疗保健系统。
【全文结束】

