当人们问我如何在医学领域区分人工智能的现实与炒作时,我建议从三个关键问题开始。
人工智能长期以来一直被视为医学领域的变革力量。然而,直到最近,它的潜力在很大程度上仍未实现。
以MYCIN为例,这是一套基于规则的人工智能系统,于1970年代在斯坦福大学开发,旨在帮助诊断感染并推荐抗生素。尽管MYCIN早期表现出色,但它依赖于僵化的预设规则,缺乏处理实际医疗中出现的意外或复杂病例的灵活性。最终,当时的科技无法匹敌熟练临床医生的细腻判断,MYCIN从未在临床上广泛使用。
快进到2011年,IBM的Watson因击败著名《危险边缘》冠军Ken Jennings和Brad Rutter而声名鹊起。不久之后,IBM将其强大的计算能力应用于医疗保健,设想其在肿瘤学领域的突破性作用。Watson的任务是整合来自医学文献和患者记录的数据,提供个性化的癌症治疗建议。然而,该AI在提供可靠、相关建议方面遇到了困难,这并非因为计算能力不足,而是由于数据源不一致且往往不完整,包括不精确的电子健康记录(EHR)条目和过于倾向于正面结论的研究文章,这些在实际临床环境中无法站得住脚。IBM在2020年关闭了该项目。
如今,医疗和科技界的领导者质疑最新一波人工智能工具,包括备受瞩目的生成式人工智能(GenAI)模型,是否会兑现其在医学领域的承诺,还是会像MYCIN和Watson一样成为历史的注脚。
Anthropic首席执行官Dario Amodei是AI乐观主义者之一。上个月,他在一篇长达15,000字的文章中预测,AI将很快重塑人类的未来。他声称,到2026年,AI工具(可能包括Anthropic的Claude)将变得“比诺贝尔奖得主更聪明”。具体到人类健康,Amodei称赞AI有能力消除传染病、预防遗传疾病并将预期寿命翻倍至150年,这一切都将在未来十年内实现。
作为《ChatGPT, MD》一书的作者,这是一本关于生成式AI在医学未来中的非虚构书籍,我对Amodei的部分愿景表示赞赏。但我的科学和医学背景使我对其最雄心勃勃的预测产生怀疑。
当人们问我如何在医学领域区分AI的现实与炒作时,我建议从三个关键问题开始:
问题1:AI解决方案能否加速人类最终可以自行完成的过程或任务?
有时,科学家们拥有解决复杂医疗问题的知识和专长,但受制于时间和成本。在这种情况下,AI工具可以带来显著的突破。
以AlphaFold2为例,这是由Google DeepMind开发的系统,用于预测蛋白质如何折叠成三维结构。数十年来,研究人员一直在努力绘制这些大型、复杂的分子,每个蛋白质的确切形状需要花费数年和数百万美元才能破译。然而,了解这些结构至关重要,因为它们揭示了蛋白质的功能、相互作用及其在疾病中的作用。
通过深度学习和大规模数据集,AlphaFold2在几天内完成了实验室几十年才能完成的工作,预测了数百种蛋白质的结构。在四年内,它绘制了所有已知蛋白质的结构,这一成就使DeepMind的研究人员获得了诺贝尔化学奖,并正在加速药物发现和医学研究。
另一个例子是匹兹堡大学和卡内基梅隆大学之间的合作项目,AI分析了电子健康记录(EHR),以识别不良药物相互作用。传统上,这个过程需要几个月的手动审查才能发现少数风险。借助AI,研究人员能够在几天内检查数千种药物,大幅提高了速度和准确性。
这些成就表明,当科学有明确路径但缺乏速度、工具和规模时,AI可以弥补这一差距。事实上,如果今天生成式AI技术在1990年代就存在,ChatGPT估计可以在不到一年的时间内完成整个基因组测序,而原本这项工作耗时13年,花费27亿美元。
将这一标准应用于Dario Amodei的主张,即AI将很快消除大多数传染病,我认为这一目标是现实的。今天的AI技术已经分析了大量有关药物疗效和副作用的数据,发现了现有药物的新用途。AI还在指导新药开发方面证明了其有效性,可能有助于应对日益严重的抗生素耐药性问题。我同意Amodei的观点,AI将在几年内完成科学家本来需要几十年才能完成的工作,为对抗病原体提供新的希望。
问题2:人类生物学的复杂性是否使得问题无法解决,无论技术多么先进?
想象一下在一个巨大的干草堆中寻找一根针。当单一答案隐藏在海量数据中时,AI可以比人类更快地找到它。但如果那根“针”是金属灰尘,散布在多个干草堆中,即使对于AI来说,挑战也是无法克服的。
这个比喻解释了为什么某些医疗问题仍然超出了AI的范围。在Amodei的文章中,他预测生成式AI将在十年内消除大多数遗传疾病、治愈癌症并预防阿尔茨海默病。
虽然AI无疑将加深我们对人类基因组的理解,但Amodei提到的许多疾病是“多因素”的,这意味着它们是由数十个基因加上环境和生活方式因素共同影响的结果。为了更好地理解这种复杂性为何限制了AI的范围,我们首先来看看较简单的单基因疾病,这些疾病更适合AI驱动的治疗。
对于某些遗传疾病,如BRCA相关的癌症或镰状细胞病,这些疾病由单一基因异常引起,AI可以通过帮助研究人员识别并潜在使用CRISPR(一种先进的基因编辑工具)直接编辑这些突变来减少疾病风险。
然而,即使是单基因疾病,治疗也相当复杂。例如,镰状细胞病的CRISPR疗法需要提取干细胞,在实验室中进行编辑,然后在高风险的条件治疗后重新输回患者体内,这些治疗对患者的健康构成重大威胁。
鉴于这一点,很明显,编辑多因素先天性疾病(如唇裂和腭裂)或晚期才显现的复杂疾病(如心血管疾病和癌症)会更加复杂。同时编辑多个基因将引入严重的健康威胁,很可能超过其带来的好处。尽管生成式AI的能力正以指数级增长,但像CRISPR这样的基因编辑技术在人类生物学方面面临严格的限制。我们的身体具有复杂的、相互依存的功能,这意味着同时纠正多个基因问题将破坏基本的生物功能,导致不可预测且可能是致命的后果。
无论AI工具变得多么先进,固有的生物学约束意味着多因素疾病将无法解决。在这方面,Amodei关于治愈遗传疾病的预测只会部分正确。
问题3:AI的成功是否取决于改变人类行为?
AI在医学应用中面临的最大挑战不是技术问题,而是心理问题:它涉及人类行为和我们倾向于做出不合逻辑或有偏见的决定。尽管我们可能认为人们会尽一切努力延长寿命,但人类的情感和习惯却告诉我们另一番景象。
以慢性病管理为例,如高血压和糖尿病。在这场战斗中,技术可以是一个强有力的盟友。目前,高级家庭监测设备和可穿戴设备可以准确地跟踪血压、血糖和氧气水平。不久,AI系统将分析这些读数,推荐饮食和运动调整,并在需要更改药物时提醒患者和临床医生。
但即使是最先进的AI工具也无法强迫患者可靠地遵循医疗建议,也无法确保医生会对每个警报作出回应。人类是有缺陷的、健忘的和易错的。患者会错过剂量、忽视饮食建议和放弃锻炼目标。在临床医生方面,繁忙的日程、职业倦怠和竞争性的优先事项常常导致及时干预的机会被错过。这些行为因素增加了不可预测性和反应迟钝,即使是最准确的AI系统也无法克服。
除了行为挑战外,还有生物学问题限制了人类的寿命。随着年龄的增长,染色体上的保护帽逐渐磨损,导致细胞停止功能。细胞的能量来源——线粒体——逐渐失效,削弱我们的身体,直到重要器官停止工作。除非替换人体内的每一个细胞和组织,否则我们的器官最终会衰竭。即使生成式AI能告诉我们如何防止这些衰竭,人们也不太可能始终遵循建议。
因此,Amodei最大胆的预测——即在十年内将寿命翻倍至150年——不会实现。AI提供了令人惊叹的工具和智慧。它将扩展我们的知识,超越我们今天能想象的一切。但最终,它无法克服人类生命自然和复杂的局限性:衰老的部分和不合逻辑的行为。
总之,当AI的承诺建立在科学研究的基础上时,你应该拥抱它们。但当它们违反生物学或心理学原则时,不要相信炒作。
关注我在Twitter或LinkedIn上。查看我的网站或我其他的一些作品。Robert Pearl, M.D.
(全文结束)

