图片说明:Unsplash/CC0公共领域
人工智能技术正日益被用于辅助医疗诊断(无论正式或非正式场合),但其在急诊医疗环境中的实际效用仍存疑问:在分秒必争、决策可能关乎生死的紧急情况下,人工智能能否有效辅助医生?
德雷塞尔大学(Drexel University)研究人员与华盛顿特区国家儿童医学中心(Children's National Medical Center)的临床医生合作开展研究,旨在明确人工智能技术在何时以及如何能够帮助医护人员挽救生命。该研究由纽约大学朗格尼健康中心(NYU Langone Health)博士后研究员、德雷塞尔大学毕业生安吉拉·马斯特里亚尼(Angela Mastrianni)博士和德雷塞尔大学计算与信息学院(College of Computing & Informatics)教授、医疗保健交互系统研究实验室(Interactive Systems for Healthcare Research Lab)主任亚历山德拉·萨尔切维奇(Aleksandra Sarcevic)博士共同领导,重点考察了人工智能辅助急诊医生制定治疗决策的两种场景。
在第一种场景中,决策所需的关键信息(包括患者年龄、受伤机制和生命体征)被实时汇总并呈现给医疗团队;在第二种场景中,除汇总信息外,系统还提供治疗建议。涉及六个医疗系统共35名急诊医护人员的实验显示,当同时提供人工智能信息和建议时,参与者做出正确决策的比例显著高于未获得AI支持的情况。
然而,参与者对在医疗紧急情况下接收AI建议的态度存在明显分歧。尽管多数医生倾向于接收AI建议和信息汇总,但部分医师担忧这些建议可能侵犯其专业自主权并导致决策偏见。研究团队近期在美国计算机协会计算机支持协同工作与社会计算会议(CSCW 2025)上公布了该发现,相关论文已发表于《ACM人机交互论文集》(Proceedings of the ACM on Human-Computer Interaction)。
萨尔切维奇指出:"尽管本研究仅涉及少量医护人员样本,但这类探究对急诊医疗界评估AI技术如何支持救生工作至关重要。该技术无疑能增强医疗环境中的人类工作能力,但明确其适用场景及被接受程度将是推动临床落地的关键。"
为达成研究目标,团队首先开发了名为"DecAide"的人工智能决策支持显示屏原型,专用于儿科创伤复苏场景。通过调查访谈各类急诊医护人员,团队确定了复苏过程中支持决策的关键信息类型及其最佳呈现方式。最终设计的显示屏以简明格式列出患者核心信息,对异常指标进行高亮提示并对生命体征变化实施颜色编码。其中一版仅呈现汇总信息,另一版则额外提供治疗建议(如输血或神经外科手术)及其基于风险计算模型的成功概率——该模型整合了国家儿童医院(Children's National Hospital)的复苏数据。
研究团队创建12个脚本化创伤患者情景进行评估,信息逐步呈现以模拟真实决策过程。在限时虚拟演练中,35名医护人员在三种条件下分别面对这些情景:无AI支持、仅AI信息汇总、以及信息汇总加治疗建议。参与者需实时判断患者是否需要输血、脑部手术、胸腔引流、气管插管等救命干预措施。
团队记录了超过800次决策过程,并将其与情景创建依据的真实数据比对以确定诊断准确率。同时设置干扰机制——每8次决策中故意提供1次错误建议,用于测试信息信任度对决策的影响。结果显示:当同时提供AI信息汇总和建议时,正确决策率达64.4%;仅提供信息汇总时降至56.3%;无AI支持时为55.8%。决策速度未受明显影响,各条件下决策耗时基本一致,且多数参与者在AI建议显示前已做出判断。
决策支持工具的使用情况呈现显著差异:18名参与者表示仅在自主决策后参考AI建议;12名医生则完全忽略AI推荐,原因包括建议缺乏临床细微差别,或因系统未提供支撑数据而缺乏信任。总体而言,医护人员对AI信息汇总呈现方式的接受度明显高于对治疗建议的接受度。
马斯特里亚尼强调:"放射学等领域正逐步采用决策支持系统,但在急诊医学等动态紧急场景中,新技术应用仍面临较大阻力。尽管AI模型已展现高精度诊断能力,但需深入研究如何在临床环境中最佳整合该技术,才能建立医护人员的信任并促进实际应用。"
研究团队建议后续工作应扩大样本规模,纳入更多医学专业和医院类型的代表。同时指出,在实施此类工具前,医疗管理者需要额外信息支持以确定实施方案,并制定清晰的使用政策框架。
更多信息:安吉拉·马斯特里亚尼等人,《推荐与否:为时间紧迫的医疗事件设计和评估人工智能决策支持》,《ACM人机交互论文集》(2025)。DOI: 10.1145/3757512
由德雷塞尔大学提供
【全文结束】

