在现代医院中,及时且准确的决策至关重要,尤其是在放射学领域,对比剂会诊通常需要基于复杂的临床指南迅速作出判断。然而,医生常常在时间紧迫的情况下做出这些决策,无法立即获取所有相关信息。对于那些必须通过避免使用基于云的工具来保护患者数据的机构来说,这一挑战尤为关键。
2025年7月2日,发表在《npj Digital Medicine》在线期刊上的一项新研究表明,检索增强生成(RAG)技术——一种使人工智能在生成回答时参考可信信息源的技术——能够显著提高本地部署的大语言模型(LLMs)在放射科对比剂会诊中的安全性、准确性和速度。这项研究由日本顺天堂大学医学研究生院副教授Akihiko Wada领导的研究团队完成。
该研究的合著者包括来自东京大学的Yuya Tanaka博士、顺天堂大学浦安医院的Mitsuo Nishizawa博士,以及顺天堂大学医学研究生院的Shigeki Aoki教授。
研究团队开发了一个基于RAG增强的本地语言模型,并在100个模拟的含碘对比剂使用案例中进行了测试。这些案例通常需要根据肾功能、过敏史和用药史等因素进行实时风险评估。该增强模型与三个领先的基于云的人工智能系统——GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku——以及其自身的基线版本(标准LLM)进行了比较。
结果令人印象深刻。RAG增强模型完全消除了危险的幻觉现象(从8%降至0%),并且响应速度明显快于基于云的系统(平均2.6秒,而云系统为4.9–7.3秒)。虽然基于云的模型表现良好,但RAG增强系统缩小了性能差距,提供了更安全、更快的结果,同时将敏感的医疗数据保留在本地。
“对于临床应用来说,将幻觉现象减少到零是一项安全突破,”Wada博士表示。“这些幻觉可能导致对比剂剂量建议错误或遗漏禁忌症。我们的系统生成了基于指南的准确回答,而不会犯这些错误。”
值得注意的是,该模型在标准医院计算机上运行效率很高,无需昂贵的硬件或云订阅——这对于放射科人员有限的医院尤其有价值。
这项工作的灵感直接来自于临床经验。“我们经常遇到需要在时间压力下查阅多个指南的复杂对比剂决策,”Wada博士回忆道。“例如,涉及多个风险因素的病例——肾功能下降、药物相互作用或过敏史。我们意识到人工智能可以简化这一过程,但前提是能够将患者数据保留在本机构内。”
RAG增强模型通过从经过整理的知识库(包括国际放射学指南和机构协议)中动态检索相关信息来运作。这确保了每个回答都基于经过验证的最新医学知识,而不是仅仅依赖于预训练的数据。
除了放射学,研究人员还设想这项技术可以应用于急诊医学、心脏病学、内科医学,甚至医学教育。它还可以为资源匮乏的农村医院和医疗保健提供者带来变革,提供即时的专家级指导。
总体而言,这项研究代表了临床人工智能领域的一项重大突破——证明了在不损害患者隐私的前提下实现专家级性能是可能的。RAG增强模型为更安全、更公平且可立即部署的医疗人工智能解决方案铺平了道路。在全球医院寻求在技术进步与伦理责任之间取得平衡之际,这项研究提供了一条实用且可扩展的前进路径。
“我们相信这代表了人工智能辅助医学的新时代,”Wada博士表示。“在这个时代,临床卓越与患者隐私并行不悖。”
更多信息: Akihiko Wada等,Retrieval-augmented generation elevates local LLM quality in radiology contrast media consultation, npj Digital Medicine (2025). DOI: 10.1038/s41746-025-01802-z
期刊信息: npj Digital Medicine
由Juntendo University Research Promotion Center提供
【全文结束】

