研究人员称医院使用的AI转录工具会编造从未说过的话Researchers say an AI-powered transcription tool used in hospitals invents things no one ever said

环球医讯 / AI与医疗健康来源:www.sunstar.com.ph美国 - 英语2024-10-27 11:00:00 - 阅读时长6分钟 - 2748字
OpenAI的AI转录工具Whisper在多个行业广泛应用,但其频繁编造内容的问题引起了广泛关注,尤其是在医疗领域的应用中可能导致严重后果。
AI转录工具Whisper编造内容医疗转录幻觉医院患者与医生咨询AI监管隐私
研究人员称医院使用的AI转录工具会编造从未说过的话

2024年2月2日,在纽约伊萨卡的康奈尔大学,一台计算机屏幕上显示了一个名为Whisper的人工智能转录程序生成的文本。在这个例子中,说话者说:“她拿到电话后,他开始祈祷”,而程序将其转录为:“我觉得我要摔倒了。我觉得我要摔倒了,我觉得我要摔倒了……”(AP照片)

旧金山——科技巨头OpenAI曾吹嘘其人工智能驱动的转录工具Whisper具有接近人类水平的稳健性和准确性。但据十几位软件工程师、开发人员和学术研究人员的采访显示,Whisper有一个重大缺陷:它容易编造大段文本甚至整句内容。这些专家表示,一些编造的内容(业内称为“幻觉”)可能包括种族评论、暴力言论甚至虚构的医疗治疗。

专家们表示,这种编造内容的问题非常严重,因为Whisper正在全球多个行业中被用于翻译和转录音频、生成流行消费技术中的文本以及创建视频字幕。更令人担忧的是,尽管OpenAI警告不应在高风险领域使用该工具,但许多医疗机构仍在竞相采用基于Whisper的工具来转录患者与医生的咨询。

问题的全部范围难以确定,但研究人员和工程师表示,他们在工作中经常遇到Whisper的“幻觉”。例如,密歇根大学的一名研究人员在研究公共会议时发现,在他检查的每10个音频转录中有8个存在“幻觉”,在他开始尝试改进模型之前。一名机器学习工程师表示,他在分析的超过100小时的Whisper转录中最初发现了约一半的“幻觉”。另一位开发者表示,他在用Whisper创建的26,000份转录中几乎每一份都发现了“幻觉”。

即使在录制良好、简短的音频样本中,问题依然存在。最近的一项研究发现,在计算机科学家检查的13,000多个清晰的音频片段中,有187个“幻觉”。研究人员表示,这一趋势会导致数百万次录音中出现数万次错误的转录。

“这样的错误可能会带来严重的后果,特别是在医院环境中,”前白宫科学技术政策办公室主任阿隆德拉·尼尔森(Alondra Nelson)说。她直到去年一直在拜登政府任职。“没有人希望出现误诊,”普林斯顿高等研究院教授尼尔森说,“应该有更高的标准。”

Whisper还被用于为聋人和听力障碍者创建字幕,这是一个特别容易受到错误转录影响的群体。因为聋人和听力障碍者无法识别隐藏在大量文本中的编造内容,“加劳德特大学技术访问项目主任克里斯蒂安·沃格勒(Christian Vogler)说,他本人也是聋人。

这一问题的普遍性导致专家、倡导者和前OpenAI员工呼吁联邦政府考虑对AI进行监管。至少,他们表示,OpenAI需要解决这一缺陷。“如果公司愿意优先处理这个问题,这似乎是可解决的,”旧金山的研究工程师威廉·桑德斯(William Saunders)说,他于今年2月因对公司方向的担忧而辞职。“如果把这个工具放出去,人们对其功能过于自信并将其集成到其他系统中,这是有问题的。”

OpenAI的一位发言人表示,公司不断研究如何减少“幻觉”,并感谢研究人员的发现,OpenAI会在模型更新中纳入反馈。虽然大多数开发者认为转录工具会拼写错误或犯其他错误,但工程师和研究人员表示,他们从未见过其他AI驱动的转录工具像Whisper那样频繁地“幻觉”。

Whisper已集成到OpenAI旗舰聊天机器人ChatGPT的一些版本中,并作为甲骨文和微软云平台的内置产品,服务全球数千家公司。它还被用于将文本转录和翻译成多种语言。仅在过去一个月内,HuggingFace开源AI平台上的一个最新版本的Whisper就被下载了超过420万次。该平台的机器学习工程师桑奇特·甘地(Sanchit Gandhi)表示,Whisper是最受欢迎的开源语音识别模型,已应用于从呼叫中心到语音助手的各种场景。

康奈尔大学的艾莉森·科恩克(Allison Koenecke)教授和弗吉尼亚大学的莫娜·斯洛恩(Mona Sloane)教授检查了从卡内基梅隆大学托管的研究存储库TalkBank获得的数千个短片段。他们发现,近40%的“幻觉”是有害或令人担忧的,因为说话者可能会被误解或歪曲。

在一个他们发现的例子中,说话者说:“他,那个男孩,准备,我不太确定,拿雨伞。”但转录软件添加了:“他拿起了一大块十字架,一小块……我肯定他没有恐怖刀,所以他杀了几个人。”

另一段录音中,说话者描述了“另外两个女孩和一位女士”。Whisper却编造了额外的种族评论,加上了“另外两个女孩和一位女士,嗯,她们是黑人。”

在第三个转录中,Whisper编造了一种不存在的药物“超激活抗生素”。

研究人员不确定为什么Whisper和其他类似工具会产生“幻觉”,但软件开发人员表示,这些编造内容通常发生在停顿、背景声音或音乐播放期间。

OpenAI在其在线披露中建议不要在决策环境中使用Whisper,因为准确性缺陷可能导致结果的重大缺陷。然而,这一警告并未阻止医院或医疗中心使用语音转文本模型(包括Whisper)来转录医生就诊时的对话,以减少医疗提供者在记笔记或撰写报告上花费的时间。

超过30,000名临床医生和40个卫生系统,包括明尼苏达州曼卡托诊所和洛杉矶儿童医院,已经开始使用由Nabla构建的基于Whisper的工具。Nabla在法国和美国设有办事处。该公司首席技术官马丁·雷松(Martin Raison)表示,该工具经过微调,可以转录和总结患者的互动。

公司官员表示,他们意识到Whisper可能会产生“幻觉”,并正在解决这一问题。由于数据安全原因,Nabla的工具会删除原始音频,因此无法将AI生成的转录与原始录音进行比较。雷松说,该工具已被用于转录约700万次医疗访问。

前OpenAI工程师威廉·桑德斯表示,删除原始音频可能会令人担忧,如果转录未经过双重检查或临床医生无法访问录音以验证其正确性。“如果你拿走了事实依据,就无法发现错误,”他说。

Nabla表示,没有模型是完美的,目前他们的模型需要医疗提供者快速编辑和批准转录音,但这可能会改变。

由于患者与医生的会面是保密的,很难知道AI生成的转录如何影响他们。加州州议员丽贝卡·鲍尔-卡汉(Rebecca Bauer-Kahan)表示,她今年早些时候带孩子去看医生时,拒绝签署健康网络提供的表格,该表格要求她同意与包括微软Azure在内的供应商共享咨询音频,微软Azure是OpenAI最大投资者运营的云计算系统。她说,她不希望如此私密的医疗对话被分享给科技公司。“这份授权书明确指出,营利性公司有权拥有这些信息,”代表旧金山郊区的民主党州议员鲍尔-卡汉说,“我绝对不同意。”

约翰·缪尔健康系统的发言人本·德鲁(Ben Drew)表示,该健康系统遵守州和联邦隐私法。


(全文结束)

大健康

猜你喜欢

  • 专家警告AI在医疗和法律转录中的“幻觉”专家警告AI在医疗和法律转录中的“幻觉”
  • AI驱动的软件开发如何改变英国医疗实践AI驱动的软件开发如何改变英国医疗实践
  • Visa支持下,Osigu获得2500万美元资金以现代化拉丁美洲医疗支付系统Visa支持下,Osigu获得2500万美元资金以现代化拉丁美洲医疗支付系统
  • 据报道,医院使用的AI语音转文字工具会编造从未说过的内容据报道,医院使用的AI语音转文字工具会编造从未说过的内容
  • 前沿AI在细胞中发现癌症和病毒,症状出现前即可检测前沿AI在细胞中发现癌症和病毒,症状出现前即可检测
  • 研究人员:医院使用的AI转录工具会编造从未说过的内容研究人员:医院使用的AI转录工具会编造从未说过的内容
  • 研究人员称医院使用的AI转录工具会杜撰不存在的内容研究人员称医院使用的AI转录工具会杜撰不存在的内容
  • 研究人员称,医院使用的AI转录工具会杜撰从未说过的内容研究人员称,医院使用的AI转录工具会杜撰从未说过的内容
  • 人工智能:改变口腔癌前病变的诊断和预后人工智能:改变口腔癌前病变的诊断和预后
  • 研究人员称医院使用的AI转录工具会编造从未说过的话研究人员称医院使用的AI转录工具会编造从未说过的话
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康