除了一个关键方面外,这种设置在医学领域相当常见:一位专家诊断医生向满屋的同事展示一个特别具有挑战性的病例,仔细分析患者的症状和初步检查结果。这位医生借助幻灯片,详细解释她的推理过程,剖析病例并考虑各种可能性。在五分钟的演讲结束时,她揭示了诊断结果以及她建议的后续步骤。
但这次有所不同?此次担任诊断医生的实际上是一个名为Dr. CaBot的人工智能系统。
哈佛医学院的研究人员正在将Dr. CaBot开发为一种医学教育工具。该系统以演示和书面两种形式运行,展示其如何分析病例,提供所谓的鉴别诊断——即解释患者状况的可能病症的全面列表——并逐步缩小可能性范围,直至得出最终诊断。
Dr. CaBot能够详细阐述其"思考过程",而非仅专注于得出准确答案,这使其区别于其他AI诊断工具。它也是少数几个专为处理更复杂医疗案例而设计的模型之一。
"我们希望创建一个能够生成鉴别诊断并以专家诊断医生水平解释其详细、细致推理过程的人工智能系统,"哈佛医学院Blavatnik研究所生物医学信息学助理教授阿琼(拉吉)·马奈(Arjun (Raj) Manrai)表示。马奈与哈佛肯尼思·格里芬艺术与科学学院博士生、马奈实验室成员托马斯·巴克利(Thomas Buckley)共同创建了Dr. CaBot。
尽管该系统尚未准备好用于临床,马奈及其团队一直在波士顿地区医院进行Dr. CaBot的演示。如今,Dr. CaBot有机会在《新英格兰医学杂志》的马萨诸塞州总医院病例记录(也称为临床病理讨论会,CPCs)中与专家诊断医生一较高下。这标志着该杂志首次发表AI生成的诊断。
发表在《新英格兰医学杂志》上的这一医学病例讨论,为了解Dr. CaBot的能力提供了窗口,展示了其对医学教育工作者和学生的有用性——并暗示了其在临床中对医生的潜在价值。随着研究人员继续改进Dr. CaBot,他们希望它能成为全球其他医疗AI团队的有用模型。
百年医疗案例传统
CPCs的概念可追溯至19世纪末,当时马萨诸塞州总医院(Massachusetts General Hospital)的医生开始使用患者病例研究进行医学教育。1900年,马萨诸塞总医院病理学家理查德·卡博特(Richard Cabot)——Dr. CaBot正是以他命名——将这些案例正式纳入哈佛医学院培训医生的课程。自1923年以来,《新英格兰医学杂志》(NEJM)持续发表这些案例作为CPCs,以教导医生如何通过复杂病例进行推理。
"这些案例相当传奇。它们以极具挑战性著称,充满干扰和误导性线索,"马奈表示。
每个CPC都包括患者医生对病例的详细展示。随后,邀请一位未参与该病例的专家向马萨诸塞总医院的同事进行演示,逐步解释其推理过程,提供鉴别诊断,然后聚焦于最可能的诊断。之后,患者医生揭示实际诊断结果。诊断专家的报告连同病例展示一起发表在《新英格兰医学杂志》上。
《新英格兰医学杂志》的文章包含一个典型病例展示,以及来自旧金山退伍军人事务医疗中心(San Francisco Veterans Affairs Medical Center)和加州大学旧金山分校(University of California, San Francisco)专家诊断医生古尔普里特·达利亚瓦尔(Gurpreet Dhaliwal)的细致鉴别诊断,马奈将其描述为"真正现代版的豪斯医生"。随后,是Dr. CaBot的鉴别诊断。
马奈和巴克利欣喜地发现,尽管Dr. CaBot分析病例的方式与达利亚瓦尔不同,但它得出了相当的最终诊断。
Dr. CaBot制作的疑难医疗案例叙述性视频演示。资料来源:马奈实验室
从卡博特医生到卡博特AI
在研究生院期间,马奈对CPCs如何揭示医生诊断过程产生了浓厚兴趣。这些案例让他想起了成长过程中喜欢的推理小说。
最近,他的实验室和其他团队研究了AI模型提供患者诊断的准确性。马奈思考是否有可能设计一个能走得更远的系统。
Dr. CaBot的核心是OpenAI的o3大型语言推理模型。在构建系统时,作为哈佛医学院AI医学方向Dunleavy研究员的巴克利,需要为o3增加新能力。
其中之一是Dr. CaBot高效搜索数百万高影响力期刊临床摘要的能力,这有助于其正确引用工作并避免事实性幻觉。Dr. CaBot还能搜索其包含数千个CPCs的"大脑",并利用这些示例复制《新英格兰医学杂志》中专家诊断医生的风格。该团队正与贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)和其他哈佛附属医院的临床医生密切合作,继续完善系统。
Dr. CaBot提供两种主要产品。
第一种是大约五分钟的叙述性、基于幻灯片的病例演示视频,系统在其中解释其如何分析各种可能性得出诊断。巴克利表示,这些演示"出人意料地逼真",包含"嗯"、"啊"和"你知道"等填充词以及口语化短语。
在团队演示过程中,"叙述性演示的真实感似乎与医生们产生了共鸣,"马奈表示。
另一种是Dr. CaBot推理和诊断的详细书面版本。
将Dr. CaBot推向实践
研究人员渴望医生们与Dr. CaBot互动并提供专家反馈。为此,他们计划在当地医院进行更多演示,并已在arXiv预印本服务器上发表了一篇描述该系统的论文。他们将《新英格兰医学杂志》CPC视为另一个获取反馈的机会。
CPC的编辑说明写道:"Dr. CaBot的AI生成讨论尚未经过正确性分析;任何存在的事实错误都已保留,以便读者观察系统的优缺点",并总结道:"AI在临床决策中是否具有合法用途,由读者自行判断。"
Dr. CaBot也可在线获取,用户可针对新病例进行教育和研究目的的测试,并查看15个现有病例的演示和报告,范围从"皮肤病变新生儿"到"进行性呼吸困难89岁老人"。
"我们真的在冒险,"马奈表示。"有被尴尬的很大可能,但通过向真正的临床医生播放五分钟视频,你学到了很多。我们正通过这种方式获得大量反馈。"
尽管Dr. CaBot的主要用途是作为教育工具,但其快速筛选数百万临床摘要的能力也可能使其成为宝贵的研究辅助工具。
据马奈和巴克利称,在考虑将其应用于实际环境之前,该工具需要进一步改进、验证并增加患者隐私保护。然而,团队指出,医生们已经表现出兴趣。
他们表示,AI系统的优势在于它随时可用、不会疲劳、不受其他责任干扰,并能快速搜索大量医学文献。
马奈补充说,有证据表明医生们使用AI工具的"数量可能会让很多人感到惊讶",包括ChatGPT和名为OpenEvidence的医生专用平台。
"我们在人机AI协作方面还处于初级阶段,"马奈表示,但该领域正在迅速发展。最终,Dr. CaBot可能会加入医生们已经在探索的AI工具箱,帮助他们确定如何最好地帮助患者。
更多信息:Gurpreet Dhaliwal等人,《36岁男性腹痛、发热和低氧血症病例28-2025》,《新英格兰医学杂志》(2025)。DOI: 10.1056/nejmcpc2412539
Thomas A. Buckley等人,《利用百年案例推进医学人工智能》,arXiv(2025)。DOI: 10.48550/arxiv.2509.12194
在线访问Dr. CaBot。
期刊信息:《新英格兰医学杂志》、arXiv
由哈佛医学院提供
【全文结束】

