新的研究表明,一种机器学习(ML)模型可以通过医生撰写的临床记录识别出疲劳状态,从而为医生临床决策的质量提供见解。这项研究发表在《自然通讯》上,旨在通过临床记录衡量疲劳并考察医生疲劳所产生的影响。
来自芝加哥大学和加州大学伯克利分校的研究人员收集了2010年至2012年间马萨诸塞州总医院布里格姆分院(Mass General Brigham)的医生记录。大多数记录是在患者就诊当天书写的。
在分析中,研究人员使用了129,228次连续急诊科(ED)就诊的数据。他们确定了每次就诊撰写临床记录的主治医生,总计60名急诊医生,在11,592个班次中工作。研究人员指出,急诊科的工作对医生来说“心理和身体要求都很高”。
研究人员通过计算医生在当前班次前七天内的工作天数来评估其工作量。他们将“高工作量”医生定义为在当前班次之前至少工作四天的医生(占14.8%),并将这些医生与那些当前班次是七天内第一次工作的医生(占19%,称为“低工作量”医生)进行对比。随后,他们训练了一个机器学习模型,以识别高工作量医生撰写的记录。
研究表明,该模型能够准确识别高工作量医生撰写的记录,同时也能够识别与高疲劳情况相关的记录,例如夜班期间或患者数量高峰时段的记录。
值得注意的是,模型识别出的疲劳迹象与较差的医生决策之间存在关联。为了评估这种关联,研究人员使用了一种先前开发的急诊质量指标:是否测试患者是否存在急性冠脉综合征(ACS)。他们评估了“测试的产出”,即测试患者的临床价值;更高的产出意味着诊断ACS的概率更高,而较低的产出则意味着测试可能没有明确的患者益处。
研究人员发现,随着模型识别的疲劳每增加一个标准差,检测心脏病发作的测试产出降低了19%。
“这一结果表明,像我们在这里使用的这种细粒度的疲劳测量方法,是一种衡量和阐明医生疲劳后果的有前途的方法。”研究人员写道。
此外,该模型还发现,由大型语言模型(LLMs)生成的临床记录比医生撰写的记录更容易与疲劳相关联。研究人员观察到,LLM生成记录被模型识别为疲劳的比例比医生撰写的记录高出74%。
这表明“大型语言模型可能会在生成文本时引入尚未完全理解的扭曲现象”,研究人员指出。
(全文结束)

