虽然人工智能技术正越来越多地被正式和非正式地用于支持医疗诊断,但它在急诊医疗环境中的效用仍是一个未解之谜。在分秒必争的决策可能决定生死的情况下,AI能否支持医生?德雷塞尔大学的研究人员与华盛顿特区国家儿童医疗中心的临床医生探讨了这一问题,以更好地了解该技术如何以及何时能帮助他们挽救生命。
这项研究由德雷塞尔大学毕业生、纽约大学朗格尼健康中心博士后研究员Angela Mastrianni博士和德雷塞尔大学计算与信息学院教授、医疗保健研究实验室主任Aleksandra Sarcevic博士领导,研究团队考察了AI技术用于支持急诊医生做出治疗决策的两种情景。
在第一种情景中,决策使用的关键信息——包括患者年龄、受伤原因和生命体征——被综合并实时呈现给团队。在第二种情景中,除综合信息外,还提供了治疗建议。
在一项涉及来自六个医疗系统的35名急诊护理提供者的实验中,研究人员发现,与不接受AI支持相比,当同时提供AI信息和建议时,参与者更可能做出正确决策。
然而,他们还发现,参与者对在医疗紧急情况下接收AI助手建议的看法存在分歧。尽管大多数人更喜欢接收AI建议和综合信息,但一些医生担心这些建议可能侵犯他们的决策自主权并导致决策偏见。
作者最近在美国计算机协会计算机支持协作工作与社交计算会议(CSCW)上展示了他们的发现。
"尽管我们的研究涉及的医疗提供者样本较小,但随着急诊医疗界考虑如何让AI技术支持其挽救生命的工作,这种调查将非常重要。毫无疑问,该技术可以增强人类在医疗环境中的工作,但了解何时何地使用它是合适且被接受的,将是推动其采用的关键。"
Aleksandra Sarcevic博士,德雷塞尔大学计算与信息学院教授
为得出这些发现,研究团队首先设计了一个AI辅助决策显示原型——命名为"DecAide"——用于儿科创伤复苏环境。通过对各种急诊医学护理提供者进行调查和访谈,研究团队了解了提供者在复苏期间用于支持决策的信息类型以及最佳呈现方式。
在此指导下,该显示形成了关键患者信息的简洁列表,突出异常情况并对生命体征的任何变化进行颜色编码。一个版本仅呈现此信息,而第二个版本还提供了建议——如输血或神经外科手术——以及基于风险计算模型的成功概率,该模型利用了主要研究地点国家儿童医院的复苏数据。
研究团队通过创建12个脚本化情景来评估参与者与系统的互动,在这些情景中逐步呈现关于创伤患者的信息。在计时虚拟练习中,35名提供者在三种条件下呈现这些情景:在一个情景中,决策支持显示不提供任何AI信息或指导;在另一个情景中提供AI综合信息;在第三个情景中,同时提供AI综合信息和建议。要求参与者在每个情景中进行实时评估,并决定患者是否需要救命干预,如输血、脑部手术、胸腔引流管或针减压、插管或胸部手术。
研究团队记录了参与者治疗和诊断过程中的每个决策——总计超过800次——将它们与创建情景的真实数据进行比较,以确定诊断准确性。每位参与者还完成了关于他们如何使用信息显示的调查。为测试信息信任和偏见对决策过程的影响,在呈现给参与者的每八次决策中,研究人员编程显示提供错误建议。
当同时提供AI信息综合和建议时,参与者在64.4%的情景中做出了正确决策。当仅提供信息综合而无建议时,这一比例降至56.3%,当未提供支持时降至55.8%。
该技术似乎并未减慢决策速度,因为参与者在实验中所有三种显示条件下的决策时间保持相对一致。而且在许多情况下,参与者在显示上提供AI辅助建议之前就已做出决策。
然而,决策支持的使用和感知差异很大。18名参与者表示,他们在做出决策后才会考虑建议。12名参与者完全忽视了AI建议,原因要么是建议缺乏细微差别,要么是参与者不信任系统,因为未提供驱动建议的数据。总体而言,参与者对AI综合信息呈现的担忧较少。
Mastrianni表示:"我们看到决策支持系统在放射学等医学专业中逐渐被采用,但在急诊医学等动态和时间关键的医疗环境中,使用这项新技术仍然存在相当大的犹豫。虽然有证据表明AI模型可以高精度诊断疾病,但我们知道需要更多研究来了解如何在临床环境中最好地整合它,以便提供者开始信任并使用这项新技术。"
研究团队建议,该领域的持续研究应包括更大的参与者群体,代表更广泛的医学专业和医院类型,同时在采用任何此类工具之前,医疗领导者需要额外的信息和支持,以决定是否以及如何实施它们,并制定围绕其使用的明确政策。
【全文结束】

