国内健康环球医讯家医百科药品库医药资讯

利用人工智能革新抗生素发现

Harnessing AI to revolutionize antibiotic discovery

美国英语生物科技
新闻源:Phys.org
2025-09-05 08:39:25阅读时长7分钟3003字
人工智能抗生素发现抗菌素耐药性机器学习新型抗生素抗菌肽生成模型药物开发公共卫生投入数据质量

内容摘要

本文系统阐述了人工智能,尤其是机器学习技术如何加速新型抗生素的发现过程。通过挖掘古代生物数据、生成新分子结构以及克服合成障碍,AI极大扩展了化学搜索空间,但抗生素开发仍需大量实验验证和资金支持。文中重点介绍了宾夕法尼亚大学团队从尼安德特人和猛犸象基因组中发现抗菌肽的突破性研究,以及麦克马斯特大学在生成模型方面的创新应用,同时分析了从实验室到临床转化面临的资金和政策挑战。

科学家们正在利用人工智能(AI)发现和生成新型抗生素。信用来源:de la Fuente-Nunez, C./mSystems, 2019

在费城的一个实验室里,一台微波炉大小的机器人正在逐个处理微型小瓶,制造出一周前还只存在于代码中的分子。

这些分子中有些源自猛犸象和尼安德特人的生物蓝图(如基因组和蛋白质组),另一些则完全由算法生成。它们正在被测试对抗日益耐药的细菌。

抗菌素耐药性(AMR)已导致全球每年大量人员死亡,并在数十年后将威胁更多人。然而,人类已数十年未发现新型抗生素,候选药物管线依然稀缺。

这就是为什么越来越多的科学家转向人工智能,将漫长且易失败的抗生素寻找过程压缩为更快、更便宜且更广泛的模式,利用数字工具发现或设计新型候选药物。

"数年前,我们萌生了将生物学视为信息源的想法,"宾夕法尼亚大学总统助理教授César de la Fuente博士表示,"如果你这样思考,就能设计算法来筛选这些代码,识别潜在抗生素。"

尽管人工智能可能成为抗生素发现的变革者,但它并未完全改写规则。将候选抗生素转化为可行疗法不仅需要计算机,还需要调动资源将药物候选者转化为临床工具。

新抗生素发现困难重重

过去40年中,发现新型抗生素类别的突破寥寥无几。这尤其令人担忧,因为AMR预计将在未来25年内导致3900万人死亡(目前平均每20秒就有一人死亡)。

尽管存在处于临床前和临床阶段的抗生素,但世界卫生组织(WHO)指出,现有创新化合物数量不足以应对日益加剧的AMR威胁。

抗生素发现的匮乏并非源于努力不足。现有抗生素大多通过勘探自然获得——在微生物中发现能杀死微生物却不伤害人类的化合物。这种传统方法一度奏效,但效果逐渐消失。

"这是一个非常实体化的过程,科学家们需要实地采集土壤和水样,尝试纯化这些复杂有机物质中的活性化合物,"de la Fuente解释道,"但你可以想象,这是个费时费力且不可预测的过程。"

更复杂的是,抗生素不能简单破坏细菌;必须考虑宿主因素。麦克马斯特大学生物化学与生物医学科学助理教授Jonathan Stokes指出:"有效的抗生素还必须可溶,在正确浓度到达解剖部位,且在此过程中不杀死宿主。"

高通量筛选技术通过实验测试数十万种化合物对抗细菌/纯化微生物靶点,帮助加快药物发现。然而,这些方法成本高昂、耗时且偏向无法穿透革兰氏阴性菌外膜的化合物(这些是AMR中最难对抗的生物体之一)。

面对这些障碍,研究人员转向了比现有抗生素储备发展更快的领域:人工智能。

人工智能加速抗生素发现

当我们谈论AI时,通常指的是机器学习(ML)——通过训练数据学习以预测新数据的算法子集;输入质量数据越多,输出预测越精准。

ML模型可快速识别模式,将无数可能性浓缩为更小范围以指导决策。这种技术已极大加速新型抗生素候选者的发现。

例如,科学家可将数万种经实验证明对目标细菌有效或无效的化合物化学结构输入ML模型。当呈现数十亿新化学结构时,模型会根据区分有效与无效化合物的特征筛选出潜在"命中"目标。

"ML模型是建议生成器,"Stokes表示,"作为科学家,我可以选取这些建议,选择最佳方案进入实验室进行真实实验。"

这些建议背后的数据既庞大又多样且基本未被开发。ML的效率和速度使科学家能在前所未有的地方寻找新抗生素——包括遥远的过去。

(古代)生物学中的抗生素挖掘

生物学长期以来一直是新抗生素的主要来源(如土壤微生物)。但在计算能力时代,寻找药物候选者不再需要挖掘泥土,而是挖掘数据。

de la Fuente实验室开创了使用ML筛选生命树基因组和蛋白质组测序数据的方法,提取具有抗菌潜力的片段。该实验室现已成为AI优先抗生素发现新兴领域的中心。

实验室主要研究方向是从现存(如人类)和已灭绝生物蓝图中识别抗菌肽——具有广泛多样性和理想抗生素特性的短氨基酸序列。

典型案例是,其团队通过解析尼安德特人和丹尼索瓦人的蛋白质组数据,发现具有预测抗菌活性的肽段。这些肽段在实验室合成后,能有效杀死体外和体内培养的鲍曼不动杆菌。

另一模型则挖掘了猛犸象、直齿象、地懒、古代海牛等古生物的蛋白质组。几种肽段(如猛犸抗菌肽-1和象抗菌肽-2)在小鼠皮肤脓肿或大腿感染模型中表现出抗感染活性,其效果通常与现有肽类抗生素多粘菌素B相当,并通过去极化细胞膜杀灭细菌。

de la Fuente指出,这种"分子复活"过程不仅为生物学和进化提供重要见解(如序列变化如何影响分子功能),还能解锁可能帮助解决当今AMR问题的分子。

利用人工智能生成新型抗生素

但如果最有前景的抗生素是尚未存在、甚至从未存在过的分子呢?理论上可能的化合物数量大约是地球上所有沙粒总数的100倍。

"这个数量太庞大了,"Stokes表示。一些化合物可能埋藏在生物代码中,另一些则存在于存储数百万化学结构的在线仓库中,ML可筛选这些仓库寻找候选抗生素。然而,考虑到化学可能性的浩瀚,这些仓库仍显局限。

解决方案是:从零开始设计新化合物。使用所谓的生成模型,科学家用已知有效或无效抗生素分子训练ML模型。

"但与其展示来自互联网的新分子图像,我们告诉模型'画出一张能展现活性的新分子图像',"Stokes解释说,这极大扩展了新型化学物质的搜索空间。

生成模型还能统合生物学和化学。de la Fuente团队最近描述了一种系统,通过病原体基因组序列或简短表型草图,建议"自然界未曾存在"的中和分子。该策略可用于应对新出现的威胁。团队还开发了系统性优化候选化合物抗菌效力的生成AI工具。

生成AI面临的难题是,它往往会设计出数字世界中看似理想但现实中几乎无法合成的化合物。Stokes团队通过使用多原子分子"构建模块"库而非逐原子组装分子的方式克服了这一障碍。

由于每个构建模块与其他片段的反应特性已知,且能通过标准化学反应快速廉价合成,该模型输出的分子不仅在理论上具有前景,且在合成上具有可行性。事实上,模型设计的化合物在实验室中展现出对鲍曼不动杆菌和其他病原体的抗菌活性。

"现在我们不再是让模型随意发挥,而是约束了化学空间,"Stokes解释说。尽管模型目前仍生成460亿种新化学物质,但确保了它们的实验可行性和治疗潜力。

制造抗生素不仅需要AI

凭借AI在数据挖掘和分子设计上的高效能力,我们即将看到新型抗生素上市?

并非如此。发现先导化合物只是漫长药物开发过程中的第一步。发现阶段后许多候选者因毒性等原因在临床试验中失败,或缺乏资金推进。抗生素开发需要大量资金,但其商业化后价格低廉且使用周期短,制药公司看到的利润微乎其微。

因此,Stokes和de la Fuente都强调,新型抗生素(无论是否涉及AI)的成功需要政府和慈善机构作为公共卫生服务进行资金投入。

AI辅助抗生素发现的未来取决于更多数据。ML模型的预测能力取决于训练数据质量。de la Fuente实验室耗时数年构建了严格筛选的训练数据集,测量数千种分子在不同细菌菌株中的最低抑制浓度(MICs),并在恒定条件下控制温度、pH值等变量以确保结果可比性。

这些模型最终可能不仅发现或生成抗生素结构。Stokes指出,研究人员必须整合AI到整个抗生素开发过程中,从临床前研究到临床试验。例如,模型可帮助预测药物在临床试验中成功或失败的可能性。

尽管潜力巨大,算法本身无法单独战胜AMR。"AI只是一支移液器,"Stokes说,"只是我们工具箱中加速解决问题的另一个工具。仅此而已。"

AI可以生成具有成功潜力的新抗生素。但最终将抗生素从实验室带出,通过开发管线送达需要的人们,仍是一项人类事业。

【全文结束】

声明:本文仅代表作者观点,不代表本站立场。

本页内容撰写过程部分涉及AI生成(包括素材的搜集与翻译),请注意甄别。

7日热榜