UCSF研究:如果ChatGPT成为医院急诊科员工会发生什么?UCSF study: What would happen if ChatGPT were a hospital ER employee?

环球医讯 / AI与医疗健康来源:www.yahoo.com美国 - 英语2024-10-11 08:00:00 - 阅读时长3分钟 - 1209字
UCSF研究人员发布了一项新研究,探讨了ChatGPT在急诊科的表现,尽管在某些方面优于当地医生,但总体上仍存在不足。
UCSFChatGPT医院急诊科人工智能临床数据患者急诊准确率偏见种族性别偏见临床实践
UCSF研究:如果ChatGPT成为医院急诊科员工会发生什么?

你会把急诊室的就诊交给人工智能吗?加州大学旧金山分校(UCSF)的研究人员在周二发布的一项新研究中回答了这个问题。

简而言之,研究人员目前不认为AI应该进行手术或为患者开药。然而,AI不仅有望成为未来医院的有益补充,更有趣的是,它已经在患者急诊过程的某些方面超越了当地医生。

实验

根据美国国家医学图书馆的数据,全国的急诊科都处于超负荷状态。因此,研究人员希望了解语言学习模型(LLM)是否至少能帮助医院处理基本的急诊患者接收任务。

UCSF研究人员收集并使用了超过10,000份真实的成人急诊就诊记录,并对全球最受欢迎的LLM之一——CHATGPT-4进行了测试。该研究测试了AI软件在患者急诊过程中的三个不同方面的表现:1. 入院状态 2. 影像学检查请求状态 3. 抗生素处方状态

这项研究是少数几项使用真实临床数据而非模拟情景评估LLM的研究之一,也是首次使用超过1,000个临床案例进行此类研究。

结果

在所有三项临床建议任务中,ChatGPT的整体表现“较差”,平均准确率低于医生。研究指出,AI软件在其建议中过于谨慎,具有高敏感性但特异性较低。

“这对临床医生来说是一个重要的信息,不要盲目信任这些模型,”该研究的主要作者、博士后学者Chris Williams说,“ChatGPT可以回答医学考试问题和帮助撰写临床笔记,但它目前并不适合需要多重考虑的情况,如急诊科的情况。”

尽管在影像学检查和抗生素处方建议方面显著落后于医生,但在确定患者进入急诊科时的初始入院状态方面,ChatGPT表现更好。ChatGPT和医生被要求通过选择“严重状况”或“较不紧急的状况(如骨折手腕)”来优先处理患者的“严重程度”和优先级。根据研究,在一个较小的500对子样本中,AI正确判断的比例为89%,而医生为86%。

尽管表现优于医生,但医生表示,AI在协助患者需求优先级排序和医院资源分配方面可以节省关键时间,以便更好地治疗最严重的患者,同时为处理多个紧急请求的医生提供决策支持工具。

前进中的问题

研究指出,偏见是将AI引入急诊科的主要问题之一。具体来说,由于训练数据中的偏见,可能会出现种族和性别偏见。

“展示AI可以做很酷的事情固然很好,但最重要的是要考虑谁从中受益,谁又受到了损害,”Williams说,“仅仅能够做某事是否就是使用AI的标准,还是能够为所有类型的患者做好某事才是标准?”

此前,GPT 3.5-turbo在被要求提供简单的心血管疾病预防建议时,提供了“大致适当的回应”。当被问及他们对其建议过程的感受时,公众表示他们更喜欢与AI的互动,并认为其同理心高于医生的回应。

“没有完美的解决方案,但既然我们知道像ChatGPT这样的模型有这些倾向,我们就必须思考如何让它们在临床实践中表现得更好,”Williams说,“即将开展的工作将解决如何在临床环境中最佳部署这项技术的问题。”


(全文结束)

大健康

猜你喜欢

  • Weave 为医疗实践推出增强型人工智能驱动的呼叫智能产品Weave 为医疗实践推出增强型人工智能驱动的呼叫智能产品
  • Nextech 将在 Eyecelerator 上探讨医疗保健中的负责任人工智能Nextech 将在 Eyecelerator 上探讨医疗保健中的负责任人工智能
  • 布朗大学推出健康信息学硕士学位布朗大学推出健康信息学硕士学位
  • 利用数据和负责任的人工智能增强医疗保健:来自微软医疗云的新创新利用数据和负责任的人工智能增强医疗保健:来自微软医疗云的新创新
  • AI在疼痛评估中的偏见揭示种族差异AI在疼痛评估中的偏见揭示种族差异
  • 非洲医疗IT领域的人工智能公司非洲医疗IT领域的人工智能公司
  • 简化临床无缝集成Dragon Medical One语音识别,实现临床试验零数据录入简化临床无缝集成Dragon Medical One语音识别,实现临床试验零数据录入
  • UCSF研究:如果ChatGPT成为医院急诊室员工会怎样?UCSF研究:如果ChatGPT成为医院急诊室员工会怎样?
  • Weave 为医疗保健实践推出增强型人工智能驱动的通话智能服务Weave 为医疗保健实践推出增强型人工智能驱动的通话智能服务
  • 人工智能在疼痛评估中暴露种族偏见人工智能在疼痛评估中暴露种族偏见
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康