一项由七位芬伯格医学院研究人员共同撰写的研究发现,人工智能在生成全面的肿瘤病理学(即癌症诊断)报告方面比医生更有能力。
该研究于4月8日发表,结论是六个开源大型语言模型生成的报告在客观指标上得分高于医生病理摘要。
Llama 3.0、Llama 3.1、Llama 3.2、Mistral、Gemma和DeepSeek-R1是此次测试的AI模型。
芬伯格教授Mohamed Abazeed博士是该研究的合著者之一,他表示他对通过解决"工作流程缺陷"(如人类对细节的关注)来寻找临床问题解决方案感兴趣。
"随着计算能力的提升和计算成本的下降,以及使用历史数据训练这些高度复杂模型的能力逐渐清晰,我们决定开始填补这些空白。"Abazeed说。
Abazeed表示,人类注意力正变得越来越有限,越来越多的人被信息淹没,往往会忽略一些细节。
研究的第一作者、放射肿瘤学五年级住院医师Yirong Liu表示,肿瘤患者往往有很长的治疗史,这意味着医生可能需要审查多年的文件,而有些医生只有大约半小时的时间与患者咨询。
Liu说,大型语言模型可以帮助"减轻"审查所有文件的负担。
"我们在研究中看到的美好之处在于,模型能够捕捉治疗过程中基因改变的变化,这非常惊人。作为临床医生,我们需要付出很多努力才能发现这些细节。"Liu说。
该研究的合著者、放射肿瘤学讲师Troy Teo表示,由于技术效率的提高,AI的使用是不可避免的。
尽管如此,Teo表示对在医疗保健中使用AI的犹豫是合理的,LLM工具应该分阶段实施。
"当新事物被引入时,持怀疑态度是合乎逻辑的,这就是为什么我们需要所有这些基准测试和测试。"Teo说。
由于该研究证明AI模型能够生成全面的报告,Teo表示下一步是弄清楚如何将AI整合到临床环境中。
Teo说,法律和伦理考虑因素,例如谁应该对AI模型犯的错误负责,应该纳入其实施过程中。
Liu表示,他将AI视为提供额外信息的工具,但不认为它可以替代医疗行业中人际交往的人性方面。
"你需要让患者感到舒适,信任你。患者更愿意亲自见到一个人类医生来推进治疗。"Liu说。
【全文结束】

