一项小型研究发现,人工智能(AI)工具在急诊患者分诊优先级评估上表现不如医生和护士。研究人员认为,这表明尽管AI在医疗领域前景广阔,但医护人员不应将可能危及生命的急诊患者护理决策外包给AI。
该研究作者之一、立陶宛维尔纽斯大学研究员雷娜塔·朱克内维琴(Renata Jukneviciene)在声明中表示:“鉴于ChatGPT等AI工具的快速发展,我们旨在探索AI能否支持分诊决策、提升效率并减轻急诊环境中的人员负担。”
这项尚未经过独立专家评审或发表在医学期刊上的研究于本周二在欧洲急诊医学大会公布。研究团队邀请六名急诊医生和44名护士评估来自在线医学数据库的随机患者案例,并按1-5级紧迫性进行分诊分类。随后研究人员让OpenAI的常用聊天机器人ChatGPT分析相同案例。
研究发现,ChatGPT的整体准确率为50.4%,而护士为65.5%,医生为70.6%。在识别真正紧急病例的灵敏度方面差距更为显著:ChatGPT为58.3%,护士为73.8%,医生达83%。然而在识别最危急或危及生命的病例时,AI模型的表现优于护士,准确率和特异度均更高。
朱克内维琴表示,这些结果表明“AI可能更一致地优先处理最紧急病例,并支持新手或经验不足的医护人员”。但她同时强调,ChatGPT将案例误判为高度紧急的概率远高于医生或护士,这意味着需要“人类监督”以防止“效率问题”。她建议:“医院应谨慎实施AI,并重点培训医护人员批判性解读AI建议。”
该研究存在一定局限性,包括样本量较小且仅在立陶宛单家医院进行。研究使用的ChatGPT模型未经医疗专项训练,因此经过微调的AI工具可能表现更佳。其他研究显示AI在诊断复杂医疗问题、更快速准确地解读X光片以及预测未来健康问题方面可能超越人类医生。但科学家也警告过度依赖AI工具可能导致医护人员技能退化。
朱克内维琴团队正计划开展新研究,采用更新的AI模型、更大规模患者群体及多种场景(如护士培训和识别异常心脏活动的心电图扫描)。她总结道:“AI不应取代临床判断,但在特定临床场景及超负荷的急诊科中,可作为决策支持工具。”
【全文结束】