Dr. Eric Topol指出,虽然关于生成式AI在临床环境中的初步发现令人鼓舞,但它们可能无法承受现实世界临床实践的复杂性。
心脏病学家和研究员Dr. Eric Topol被许多人认为是讨论技术对医疗保健影响的主要声音之一。Topol博士近二十年来一直担任斯克里普斯研究所转化医学研究所的创始人和主任,最近他在芝加哥举行的北美放射学会年度会议上发表了主题演讲,分享了他对生成式AI在临床环境中表现的看法。
他指出,几项最新研究表明,AI在临床任务(如鉴别诊断)方面超过了医生。例如,《美国医学会杂志》(JAMA)10月发布的一项研究显示,OpenAI的ChatGPT实现了90%的诊断准确率,而由ChatGPT辅助的医生得分为76%,仅使用传统资源的医生得分为74%。
“这并不是我们预期的结果。我们原本以为结合AI的混合模式会是最好的。”Topol博士表示。
他补充道,存在三个原因导致这一现象。首先,医生对自动化的偏见可能是AI超越混合模型的因素之一。其次,医生对生成式AI工具的熟悉程度有限,不知道如何最佳使用这些工具。第三,“这些是人为设计的实验,不是真实世界的情况”,Topol博士说。
大多数测试生成式AI在医疗保健领域的研究是在受控环境中进行的,通常使用的是模拟数据,而不是来自真实患者的数据。“我们不应过早得出结论,认为AI比医生加AI在这些任务上更好——因为这些不是真实的医学任务。”Topol博士说。他指出,一项4月份的论文分析了500多项关于大型语言模型在医疗保健领域的研究,发现其中只有5%是基于真实患者数据进行的。
对于大多数生成式AI在临床环境中的应用案例,仍然有待观察它们是否能超过或至少匹配医生的表现。然而,这并不适用于环境记录模型,Topol博士指出。全国各地的医院正在现实环境中部署这些工具,这些工具由Abridge、Microsoft、Suki和DeepScribe等公司出售。
用于临床文件处理的AI工具已经证明其能够有效简化工作流程,提高准确性,并每天减少医生数小时的行政工作量。Topol博士认为,这些结果表明生成式AI在临床环境中的未来依然光明。
(全文结束)

