研究显示医生在临床推理方面仍优于人工智能
一项发表在《新英格兰医学杂志》上的研究揭示,尽管大型语言模型在多项选择题医学考试中表现卓越,但在临床推理能力上仍显著落后于人类医生。阿尔伯塔大学神经科住院医师利亚姆·麦科伊(Liam McCoy)通过脚本协调测试发现,AI模型难以根据新信息动态调整判断,经常错误地将无关信息(如患者脚趾受伤史)纳入诊断过程,且过度自信地解释错误结论。研究测试了来自谷歌、OpenAI等机构的10款主流AI模型,结果显示其水平仅相当于医学生初级阶段,远未达到资深医师标准,这表明医学诊断不仅需要知识储备,更需处理不确定性和复杂情境的灵活性,当前AI技术尚无法安全替代医生完成完整诊疗过程。

