AI尚不具备管理医院急诊室的能力,一项新的研究得出结论。
研究人员在10月8日发表于《自然通讯》杂志上的报告中指出,ChatGPT可能会要求一些患者进行不必要的X光检查和抗生素治疗,并收治那些实际上不需要住院治疗的患者。
“这是一个重要的信息,提醒临床医生不要盲目信任这些模型,”首席研究员Chris Williams说,他是加州大学旧金山分校的博士后学者。“ChatGPT可以回答医学考试问题和帮助撰写临床笔记,但它目前的设计并不适用于需要多重考虑的情况,如急诊科的情况,”Williams在UCSF的新闻发布会上补充道。
在新研究中,研究人员挑战了ChatGPT AI模型,要求它提供类似于急诊科医生在初步检查患者后会做出的建议。
研究团队将1,000次之前的急诊科就诊数据输入AI,这些数据来自超过251,000次的就诊记录存档。
AI需要回答“是”或“否”,以确定每个患者是否应该被收治、进行X光检查或开具抗生素。总体而言,ChatGPT倾向于推荐比实际所需更多的服务,结果显示。ChatGPT-4模型的准确性比人类医生低8%,而ChatGPT-3.5的准确性低24%。
这种过度处方的倾向可能是因为AI模型是在互联网上训练的,Williams说。合法的医疗建议网站并不是为了回答紧急医疗问题设计的,而是为了引导患者去找医生。
“这些模型几乎被微调到说‘寻求医疗建议’,这从公众安全的一般角度来看是正确的,”Williams说。“但在急诊科环境中,过于谨慎并不总是合适的,因为不必要的干预可能会给患者带来伤害,消耗资源,并导致患者成本增加。”
为了在急诊科中更加有用,AI模型需要更好的框架,由设计师构建,能够在捕捉严重疾病的同时避免不必要的检查和治疗,Williams说。“没有完美的解决方案,”他说,“但了解像ChatGPT这样的模型有这些倾向,我们就有责任思考它们在临床实践中应该如何表现。”
资料来源:加州大学旧金山分校,新闻发布会,2024年10月8日
(全文结束)

