总体而言,医生们是一群相当聪明的人,但他们可能对变化有抵触情绪。最著名的例子可能是19世纪的外科医生,他们拒绝在从停尸房到产房之间洗手,传播了当时尚未被发现的微生物,导致婴儿死亡。匈牙利医生伊格纳兹·塞梅尔韦斯(Ignaz Semmelweis)收集统计数据显示肥皂和水可以挽救生命,但他却遭到了嘲笑和孤立。
如今,我们生活在更加开明的时代,医学实践通常都有证据支持——但我们是否总是得到了能够带来改变的正确证据呢?例如,有迹象表明,将人工智能引入临床使用也可以挽救生命。正如我们在“AI帮助放射科医生在实际测试中发现乳腺癌”一文中报道的那样,选择使用图像分类AI来帮助检测乳腺癌的放射科医生,在每1000个筛查对象中多发现了额外的一例癌症。在医疗体系中,这一效果可能会很大。
这是否意味着我们应该鼓励医生脱下手术服,让机器接手工作呢?远非如此。尽管像ChatGPT这样的大型语言模型AI系统可以在多项选择题的医学测试中表现出色,但在对话式诊断方面表现较差(参见“AI聊天机器人无法通过与患者的交谈进行诊断”)。目前,一位拥有良好床边风范和倾听耳朵的医生仍然是至关重要的。
相反,我们可以从这些研究中得出两个结论。第一个结论是我们应该谨慎使用通用术语“人工智能”。虽然我们报道的这两个系统共享一个基础神经网络技术,但图像分类与文本生成是非常不同的任务,后者存在更高的风险,即AI可能会输出看似合理但实际上错误的结果。换句话说,并非所有AI都是平等的。
第二个结论是,我们应该更大胆地在现实环境中测试医疗AI系统,而不仅仅是实验室或模拟环境中。乳腺癌研究通过给予放射科医生控制何时使用AI的权利,证明它可以是一个有用的工具。如果我们能推动获得更多这样的证据,就像塞梅尔韦斯之后的情况一样,生命可以得到挽救,而现在他被视为医学英雄。
(全文结束)

