AI能否比医疗保健提供者更准确地检测认知能力下降 新研究揭示惊人准确率Can AI detect cognitive decline higher than a health care provider? New examine reveals shocking accuracy - YACAK

环球医讯 / 认知障碍来源:yacak.com美国 - 英语2026-01-29 06:16:31 - 阅读时长4分钟 - 1873字
一项发表于2026年1月7日《npj数字医学》(npj Digital Medicine)期刊的研究表明,人工智能系统通过分析医生笔记中的细微模式,能够比医疗保健提供者更精准地识别早期认知能力下降迹象;该AI采用多智能体工作流,在初始测试中与临床医生判断一致率达91%,实际场景敏感性降至62%但专家复核显示44%情况下AI分析更准确,突显人工审查在处理细微症状时的局限性;系统旨在作为筛查辅助工具而非替代医疗决策,可帮助临床医生在资源有限环境下优先跟进高风险患者,但其推广受限于医疗文档质量差异和单中心数据局限,目前尚未投入实际医疗应用。
AI认知能力下降医疗保健提供者准确率医生笔记筛查辅助工具多AI智能体病历审核早期迹象npj数字医学
AI能否比医疗保健提供者更准确地检测认知能力下降 新研究揭示惊人准确率

认知能力下降的最早迹象通常不会出现在正式诊断中,而是埋藏在医疗保健提供者笔记的细微线索里。

一项于2026年1月7日发表在《npj数字医学》(npj Digital Medicine)期刊的新研究指出,人工智能(AI)可通过扫描医生笔记中的疑虑模式来识别这些早期迹象——例如记忆与思维问题或行为变化。这些模式可能包括患者反复提及的认知变化或困惑,或是陪同就诊的家属讨论的担忧。

该系统并非直接诊断认知能力下降或痴呆症,而是旨在标记出病历显示可能需要更密切关注的患者。

“目标并非取代医疗判断,而是作为筛查辅助工具,”研究合著者、麻省总医院(Massachusetts General Hospital)神经病学副教授丽迪亚·穆拉博士(Dr. Lidia Moura)向Live Science表示。她指出,通过突出这类患者,该系统可帮助临床医生确定需跟进的对象,尤其在专科医生短缺的环境中。

加州大学旧金山分校(University of California, San Francisco)健康信息学家朱莉娅·阿德勒-米尔斯坦(Julia Adler-Milstein,未参与本研究)表示,此类筛查是否真正惠及患者取决于其应用方式。她在邮件中向Live Science解释:“若预警准确、传递至护理团队合适人员且具可操作性——即能导向明确后续步骤——那么它们便能无缝融入医疗工作流程。”

多AI智能体协作 而非单一系统

为构建新AI系统,研究人员采用了所谓“智能体化”(agentic)方法。该术语指一套协调运作的AI程序——本研究中为5个——各自承担特定角色并互相审核工作成果。这些协作智能体在无人工干预下,通过迭代优化系统对医疗笔记的解读方式。

研究团队基于Meta的Llama 3.1模型构建系统,并提供三年医生笔记供其学习,包括门诊记录、进展笔记和出院摘要。这些数据源自医院注册库,且已由临床医生审核过是否标注特定患者的认知问题。

研究组首先让AI接触平衡的患者笔记集(一半记录认知问题,一半无记录),使其在尝试匹配临床医生标注方式的过程中从错误中学习。该流程结束时,系统与临床医生的判断一致率达91%。

最终系统随后在独立子集数据上接受测试,这些数据虽来自同一三年数据集但此前未接触过。第二数据集旨在反映真实医疗场景,因此仅约三分之一病历被临床医生标记为显示认知疑虑。

在此测试中,系统敏感性降至约62%,意味着它漏检了近四成临床医生标注为认知衰退阳性迹象的病例。

初看之下,准确率下降似属失败——直至研究人员重新审视AI与人工审核者分类不同的医疗记录。

科学专家通过重读这些记录进行复核,且不知分类源自临床医生还是AI。在44%的病例中,这些评审者最终支持系统的评估而非医疗保健提供者最初完成的病历审核。

“这是较令人惊讶的发现之一,”研究合著者、麻省总医院神经病学副教授侯赛因·埃斯蒂里(Hossein Estiri)表示。

他指出,在许多此类病例中,AI比医生更保守地应用医学定义:当笔记未直接描述记忆问题、困惑或患者思维变化时,AI拒绝标记问题——即使文档其他部分列有认知能力下降诊断。AI被训练优先关注潜在认知问题的提及,而医生未必总在当下将其视为关键。

穆拉表示,结果凸显了医生手动病历审查的局限性。“当迹象明显时,人人都能察觉,”她说,“当它们细微时,正是人机判断可能分岔之处。”

未参与本研究的皇家墨尔本理工大学(RMIT University)AI与健康技术研究员卡琳·弗斯珀(Karin Verspoor)指出,系统在经临床医生精心审核的医生笔记集上接受评估。但她警示,由于数据源自单一医院网络,其准确率可能无法迁移至文档实践不同的环境。

她认为,系统视野受限于所读笔记质量,而此约束只能通过在多样化医疗环境中优化系统来解决。

埃斯蒂里解释,目前该系统旨在常规医生就诊后台静默运行,在标记潜在问题时同步提供推理依据。不过,它尚未投入医疗实践。

“构想并非让医生坐着使用AI工具,”他说,“而是让系统作为病历本身的一部分,提供洞察——我们观察到的现象及其原因。”

Tian, J., Fard, P., Cagan, C. et al. An autonomous agentic workflow for medical detection of cognitive issues using large language models. npj Digit. Med. 9, 51 (2026).

【全文结束】

猜你喜欢
  • NHS试验“开创性”人工智能与机器人技术检测肺癌NHS试验“开创性”人工智能与机器人技术检测肺癌
  • 人工智能如何重塑全球传染病防控准备能力人工智能如何重塑全球传染病防控准备能力
  • 神经学家分享可提示亲人患痴呆症的"简单"绘图测试神经学家分享可提示亲人患痴呆症的"简单"绘图测试
  • AI在医疗诊断中的应用:在疾病发作前捕捉病兆AI在医疗诊断中的应用:在疾病发作前捕捉病兆
  • AI随叫随到:智能代理系统如何变革医疗保健一线AI随叫随到:智能代理系统如何变革医疗保健一线
  • 眼部检查可能实现系统性疾病的早期检测眼部检查可能实现系统性疾病的早期检测
  • 神经学家称快速"手部测试"有助于早期发现痴呆症风险神经学家称快速"手部测试"有助于早期发现痴呆症风险
  • 老年认知评估指南:现代照顾者的实用手册老年认知评估指南:现代照顾者的实用手册
  • 神经科医生分享简易绘图测试 可指示亲人是否患痴呆症神经科医生分享简易绘图测试 可指示亲人是否患痴呆症
  • 简易网球测试可作为痴呆症的有效指标简易网球测试可作为痴呆症的有效指标
热点资讯
全站热点
全站热文