制药企业正 increasingly harnessing AI to accelerate drug discovery. 但AI究竟将彻底改变新药研发进程,还是效益被过度炒作?贾斯敏·福克斯-斯凯利带来深度报道。
发现新药曾需耗时十余年研究和数十亿英镑投资。大量候选药物在研发途中失败,仅癌症药物临床试验失败每年就使制药行业损失约500-600亿美元。然而AI算法可将先导化合物筛选时间缩短至数周甚至数日。
"药物研发的首要步骤是确定'命中'或先导化合物,而AI已彻底解决这一问题,"英国剑桥大学生物物理学教授米歇尔·文德鲁斯科洛(Michele Vendruscolo)表示。
传统药物研发始于对数以千计化学化合物的"高通量"筛选,以确定哪些化合物能与靶标蛋白结合并相互作用,此过程耗时可达两年。AI能显著加速该流程。化学文库包含数十万分子的信息,包括其化学结构和物理特性。基于这些数据,AI模型可通过快速分析海量信息,预测分子如何与靶标蛋白结合及相互作用。研究人员能从数百万潜在候选物中筛选出最有前景的先导化合物。
"我们拥有数十年X射线晶体学和显微光谱研究数据,"文德鲁斯科洛解释道,"已知数十万蛋白质的结构。AI极擅长从这类海量结构数据中学习。"
高通量筛选新突破文德鲁斯科洛指出,AI目前预测蛋白质结构及小分子相互作用的准确性已媲美实验筛选方法,但这仅适用于能通过折叠形成立体稳定结构并具有结合口袋的蛋白质。
"教科书定义蛋白质会折叠至天然状态后发挥功能,"文德鲁斯科洛说,"但约三分之一的人类蛋白质并非如此。"
这些"内在无序"蛋白质无法形成单一构象,因此无法通过标准实验和计算方法确定结构。其中许多与人类疾病相关,包括阿尔茨海默病和帕金森病等神经退行性疾病。此类蛋白质曾被视为"不可成药"靶点。
"传统药物研发中的结合概念称为'锁钥模型':蛋白质表面存在类似锁的口袋,小分子如钥匙嵌入缝隙,"文德鲁斯科洛解释,"但若蛋白质无固定结构,则既无锁也无钥匙。目前尚无靶向无序蛋白质的获批药物,因其缺乏结合口袋。"
文德鲁斯科洛团队利用AI发现新型结合机制——小分子无需结合口袋即可发挥作用。团队聚焦阿尔茨海默病相关的内在无序蛋白β-淀粉样蛋白。该蛋白聚集成斑块环绕神经元,导致细胞死亡。
在即将发表的研究中,团队运用AI快速筛查含数百万小分子的化学文库,筛选出五种需深入研究的化合物。这些化合物不与特定口袋结合,而是"环绕"无序的β-淀粉样蛋白运动后与蛋白分子结合,使其稳定并阻止聚集。
"无序结合的规则可能比锁钥模型复杂得多,"文德鲁斯科洛表示,"但基于深度神经网络、含万亿参数的AI程序有望理解这些规则。"
非吸烟者肺癌肿瘤的基因构成与吸烟者完全不同。在非吸烟者中,肿瘤细胞表面的激酶受体蛋白通常存在大量突变。
由于缺乏训练模型的数据,AI在预测药物人体毒性方面进展甚微。
抗微生物药物新探索
AI预测分子与蛋白质结合的能力也被用于新型抗生素研发。当今多数抗生素发现于50多年前,制药公司因细菌耐药性发展迅速而基本放弃新抗生素开发。
研究者寄望AI通过探索非常规来源或设计自然界不存在的全新分子来解决此问题。此类药物可能更难引发细菌耐药性。
美国宾夕法尼亚大学总统特聘副教授塞萨尔·德·拉富恩特(César de la Fuente)十余年来利用AI挖掘基因数据库寻找抗菌分子。2023年,他与团队在尼安德特人和丹尼索瓦人DNA中搜寻可能编码抗菌肽的基因,发现一种肽"尼安德特素-1"(neanderthalin-1)。实验室重组后,该肽成功治愈小鼠细菌感染。
2024年,团队运用新型AI深度学习模型APEX扫描"灭绝组"(extinctome)——科学界已测序的208种灭绝生物基因组。最近,德·拉富恩特利用AI扫描233种古菌(远古单细胞微生物),获得超12,000种抗生素候选物。其中80种经合成测试,93%能有效中和六种常见致病菌。
"我们正实验观察不同细菌对分子的耐药性演化,"德·拉富恩特说,"既从细菌角度分析古菌基因组突变,也从分子角度研究特定氨基酸序列如何降低耐药风险。"
研究者希望AI能预测细菌对新药的耐药演化路径。
"整合这些信息可训练AI模型,输出未来突变路径的概率预测,从而指导新药研发,"德·拉富恩特表示。
美国麻省理工学院医学工程与科学教授詹姆斯·柯林斯(James Collins)同样利用AI发现新型抗生素。2020年其团队发现化合物"哈里辛"(halicin),可杀死耐抗生素的大肠杆菌等细菌。哈里辛是全新抗生素类别,通过破坏细菌维持跨膜电化学梯度的能力发挥作用——此机制前所未见。2025年,团队要求AI设计对抗超级细菌的假想抗生素分子,旨在生成新结构以降低耐药风险。两种潜力最大的抗生素经合成测试,均能杀死实验室中的耐甲氧西林金黄色葡萄球菌(MRSA)和耐药淋球菌,并治愈感染小鼠。
"AI有望彻底改变抗生素研发模式,"美国阿拉巴马大学地质科学教授黑兹尔·巴顿(Hazel Barton)表示,"例如发现自然界无法合成的全新分子,因其化学结构对生物体而言不可能复制。"
内在无序蛋白质无法形成单一构象,许多与阿尔茨海默病和帕金森病相关。此类蛋白质直至近年仍被视为"不可成药"。
AI有望预测:分子进入人体试验前的毒性;分子穿越血脑屏障的能力;以及联合用药的相互作用。
临床后期应用
尽管AI在发现"命中"化合物方面表现出色,但这仅是药物研发环节之一。
"多数药物并非失败于命中化合物发现阶段,"文德鲁斯科洛强调,"尤其需验证化合物毒性、有效性,以及从小鼠研究到人体临床试验的剂量转换。这些参数主要通过试错确定,存在巨大不确定性,导致高失败率。"
部分企业认为AI也能解决这些问题。美国德克萨斯州肿瘤生物技术公司Lantern Pharma运用AI分析为何特定癌症亚群对治疗响应更佳。团队向机器学习模型输入海量临床试验数据,探究肿瘤产生的基因或蛋白质能否预测药物疗效。
"初始目标是拯救晚期癌症临床试验失败的药物,"Lantern Pharma首席执行官潘纳·夏尔马(Panna Sharma)表示。
该公司聚焦LP-300药物——2006至2013年间五次肺癌和乳腺癌III期试验均告失败。后续分析显示,该药对特定类型肺癌的非吸烟者有效。
"失败源于针对错误患者群体,"夏尔马解释,"我们用AI确定非吸烟者体内的作用机制。"
结果令人震惊:非吸烟者肺癌肿瘤的基因构成与吸烟者截然不同。非吸烟者肿瘤细胞表面的激酶受体蛋白通常存在大量突变。激酶受体主要与生长因子结合,触发细胞内级联反应,驱动细胞生长、存活和迁移。激酶受体突变可导致失控性细胞增殖,引发多种侵袭性癌症。
"我们的药物通过结合非吸烟者过表达的激酶受体并使其变性,从而抑制癌症生长,"夏尔马说。
LP300目前正在针对晚期肺腺癌(非小细胞肺癌亚型)非吸烟者的II期临床试验中测试。
夏尔马认为,通过精准匹配药物与患者,AI可显著加速药物研发进程。
"确定分子后,选择正确适应症至关重要,"夏尔马表示,"某些癌症对特定药物响应更佳,若能早期理解其原理,将有助于临床精准定位该分子。"
临床定位通常耗时1-3年,但夏尔马相信AI可压缩50-75%时间。他认为AI能预测:分子进入人体试验前的毒性;穿越血脑屏障的能力;以及联合用药的相互作用。甚至药物研发中最漫长且失败率最高的临床试验环节,也可通过AI优化——例如靶向基因组特征显示最可能受益的患者。
"因针对更精准人群且机制更明确,试验成功率将提高,"夏尔马说,"试验成本也可能降低20-30%,因能更准确筛选目标患者。"
然而其他科学家对AI在药物研发中的作用持更谨慎态度。尽管制药公司自2010年代中期开始应用AI研发新药,但尚无AI研发药物通过III期试验。
"AI在数据充足时表现优异,但数据匮乏时作用有限,"文德鲁斯科洛指出,"有些问题目前无法解决,或许近期也无法突破,因数据不足或分散无序。"
他特别指出,预测药物人体毒性是AI进展甚微的领域,源于训练模型所需数据匮乏。
"化合物可通过百万种方式产生毒性,这正是AI hype 遭遇现实之处。我认为应重视AI解决的具体问题,同时清醒认识其局限性。"
【全文结束】

