痴呆症对全球患者及其家庭造成毁灭性影响,因此医生及早发现痴呆症征兆并提供适当的预防和治疗至关重要。麻省总医院(Massachusetts General Hospital)的研究人员开发了一种AI工具,可扫描医生记录以识别认知衰退的迹象。
研究团队开发的这款AI工具能够扫描医生记录,并对需要更多关注认知功能的患者进行标记。他们没有创建单一AI,而是构建了五个协作式AI程序,每个程序都采用"代理"方法,相互审查和改进彼此的工作。
该AI工具基于Meta的Llama 3.1构建,并使用为期三年的医疗记录进行训练,包括患者就诊记录、病程记录(progress reports)和出院总结(discharge summaries)。这些数据来自真实医院环境,临床医生曾审查过这些医疗记录以发现认知问题。
首先,研究人员向AI提供了包含和不包含认知问题的平衡医疗记录集,并进行训练,直到其判断与临床医生标记的匹配率达到91%。随后,该AI工具在独立数据集上进行测试,以评估其标记认知问题的准确性。为更好地反映现实医疗场景,第二个数据集约三分之一的记录被临床医生标记为存在认知问题。
在测试中,该AI工具的敏感度降至约62%——这意味着它漏掉了10份就诊记录中临床医生标记为"认知衰退令人担忧"的4份。虽然这一结果单独看来似乎表明AI工具存在不足,但当研究团队重新检查就诊记录和AI工具的诊断时,他们发现AI工具和人类临床医生对结果的分类存在系统性差异。
研究人员随后让临床医生重新审查16份AI工具与人类判断结果不同的咨询记录,且未告知他们这些记录是由AI还是人类标记的。重新审查后,临床医生在7例(约44%)案例中更倾向于AI工具的标记而非最初的医生判断。"这是最令人惊讶的发现之一,"该研究的合著者、麻省总医院神经病学副教授侯赛因·埃斯蒂里(Hussein Estiri)表示。
据埃斯蒂里介绍,即使医疗记录中直接记载了明显的记忆问题、混乱或患者思维变化,AI也不会标记这些情况。这意味着AI比临床医生应用了更为严格的诊断标准,从而导致诊断结果与临床医生不同。
"AI工具的目标不是取代临床判断,而是作为筛查的辅助手段,"该论文的合著者、麻省总医院神经病学副教授莉迪亚·莫拉(Lydia Moura)表示。在临床医生短缺的情况下,AI工具可帮助确定哪些患者应接受后续护理。
需要注意的是,此次开发的AI工具基于从单一医院网络获取的数据,因此在记录方法不同的医疗环境中,其结果可能不准确。
埃斯蒂里表示,该AI工具旨在医生常规就诊期间在后台安静运行,自动标记潜在问题。"概念并非医生坐下来专门使用AI工具,而是AI系统成为临床记录的有机组成部分,为医生提供对其观察内容的深层洞察及原因解释,"埃斯蒂里说。
【全文结束】

