基于大型语言模型的AI智能体驱动的模拟患者系统有望变革医学教育
摘要
背景:
模拟患者系统在医学教育和研究中至关重要,提供安全、综合的培训环境并支持临床决策。渐进式人工智能(AI)技术,如大型语言模型(LLM),可通过高保真度和低成本复制医疗状况与医患互动,从而推进模拟患者系统发展。然而,系统有效性和可信度仍是主要挑战。
方法:
我们开发了AIPatient,一种由基于LLM的AI智能体驱动的模拟患者系统。该系统整合检索增强生成(RAG)框架,由六个特定任务的LLM智能体支持复杂推理过程。为提升模拟真实性,系统基于重症监护医学信息集市(MIMIC)-III数据库的去标识化真实患者数据构建AIPatient KG(知识图谱)。
结果:
本研究证实该系统在电子健康记录(EHR)医学问答(QA)、可读性、鲁棒性和稳定性方面表现卓越。当全部六个智能体协同工作时,系统QA准确率达94.15%,显著优于部分或无智能体集成的基准测试。其知识库展现高有效性(F1分数=0.89)。可读性评估显示Flesch阅读难易度中位数为68.77,Flesch-Kincaid年级中位数为6.4,表明内容适合所有医疗专业人员理解。鲁棒性与稳定性通过非显著方差验证(ANOVA F值=0.6126,p>0.1;F值=0.782,p>0.1)。针对医学生的用户研究表明,AIPatient在病史采集中提供高保真度、高可用性和卓越教育价值,表现达到甚至超越人类模拟患者。
结论:
基于大型语言模型的模拟患者系统能提供准确、易读且可靠的医疗交互体验,展现出变革医学教育的显著潜力。
简明语言摘要
模拟患者系统用于在真实但安全的临床环境中培训医学生。然而,由人类演员扮演的模拟患者存在成本高昂且难以规模化的问题。本研究开发的AIPatient人工智能系统,能够基于现有真实电子健康记录模拟多样化患者互动。经评估,该系统在医学问题解答中达到高准确率,输出回应清晰一致,且被医学生评为高度真实。与人类模拟患者相比,AIPatient在病史采集等关键环节表现相当甚至更优。这些成果表明,基于AI的模拟患者技术有望使医学教育更加普及、可扩展,并在不同培训环境中保持一致性,为全球医学教育提供创新解决方案。
【全文结束】

