药物研发通常是一个漫长而艰难的过程,但人工智能的进步可能有助于简化这一流程的每个阶段。在这篇《新闻与观点》文章中,JMIR通讯记者Benedette Cuffari报道了近期创新及其对药物发现的潜在影响。
关键要点:
- 人工智能正在通过机器学习、深度学习和生成建模方法,更高效地识别、设计和优化候选药物,从而改变临床前药物研发。
- 虚拟筛选、分子对接和从头设计方法正越来越多地整合到药物发现流程中,以改善药物-靶点相互作用的预测并加速先导化合物优化。
从"实验室到病床",药物发现和研发是一个高度复杂的过程,通常需要10到15年或更长时间,一种新分子才能进入市场。药物研发通常始于生物靶点的识别和验证,例如与疾病相关的受体、酶或信号蛋白。随后,候选分子需经过体外高通量筛选(HTS),以优化药物活性、靶点亲和力和毒性特征,之后化合物才会经历广泛的临床前和临床测试。总体而言,单个药物分子的研发成本平均为26亿美元,这些高成本归因于每个阶段的顺序性质。
人工智能(AI)技术的最新进展正在实现更快、数据驱动的候选药物识别和优化,有望降低研发时间和成本。这些进步正在改变药物发现的每个阶段,从靶点识别到分子设计和优化。
机器学习在药物发现中的应用
机器学习(ML)是人工智能的一个子集,使系统能够从化学库、生物测定和临床试验中学习有标签或无标签的数据;预测结果;并生成可操作的见解。机器学习方法最初于20世纪80年代和90年代引入药物发现过程,在此期间,随机森林、支持向量机(SVMs)和其他机器学习算法被用来根据学习数据集模拟分子结构与生物活性之间的层叠关系。
到2000年代初,能够处理海量数据的深度学习(DL)算法增强了这些系统预测结构和分子特性的能力。特别是,从高通量筛选和其他多参数分析中获取的生物和化学数据被分析用于建模和预测药物-靶点相互作用。参与药物发现的现代深度学习工具包括图神经网络——一种强大的分子建模系统,可预测溶解度和蛋白-配体相互作用——而Transformer架构则在靶点/药物优先级排序过程中建模长距离依赖关系和上下文关系。
约90%的候选药物在I期、II期或III期临床试验中失败,结果不成功主要归因于临床疗效不足,以及难以管理的毒性、次优的药物样特性以及战略规划不佳。为了提高新药物的安全性,已经开发了人工智能模型,如定量构效关系(QSAR)建模和深度学习,以评估吸收、分布、代谢、排泄和毒性等多方面的特征。例如,ChemMORT是一个近期的基于深度学习的分析平台,它依靠简化的分子输入线性入口系统(SMILES)编码器、描述性解码器和分子优化器,更好地预测候选药物在生物系统中的行为。
为何药物研发仍然昂贵
尽管计算能力有了近期发展,但制药创新并未相应地变得更快速或更便宜。这种对比常被描述为"埃罗姆定律"——即即使数字技术迅速发展,药物研发却变得越来越昂贵。
耶鲁大学生物医学信息学、分子生物物理学和计算机科学教授Mark Gerstein博士表示,这一悖论有助于解释为什么对人工智能的热情应该用现实来平衡。Gerstein说:"在药物发现中,人们对人工智能非常兴奋,但现实是我们并没有像希望的那样成功地发现药物。"
计算机在摩尔定律下持续改进——微芯片上的晶体管数量每2年大约翻一番——而基因组测序成本已大幅下降。然而,这些效率并未消除导致失败率和研发成本的生物和临床挑战。
基于结构的人工智能设计
生成化学,也称为"药物设计",涉及创建旨在成为稳定、有效和具有药物潜力的独特分子化合物。利用机器学习和深度学习算法,虚拟筛选通常在药物开发的早期阶段用于了解庞大数据库的结构和特性,并预测它们与特定药物靶点的潜在相互作用。
例如,基于结构的虚拟筛选(SBVS)利用分子对接,根据药物候选物与靶蛋白的预测相互作用来识别药物候选物。支持向量机和随机森林模型等机器学习算法预测蛋白质活性位点内的配体结合,使药物化学家能够合理地修改功能基团以提高结合亲和力。
Gerstein还指出,等变神经网络是AI驱动药物发现的一个有前途的进展。由于分子遵循物理定律并可以旋转、拉伸或改变其构象,预测模型必须考虑这些转换。等变架构旨在保持这些关系,使其对分子建模和结合预测特别有价值。
与基于现有化学库创建类药物候选物的基于机器学习的方法相比,从头设计可用于生成具有特定效价和选择性特性的新化合物。为此,可以对已知分子的数据集进行训练生成模型,如变分自编码器和生成对抗网络(GANs),以学习其结构特性并生成具有类似特性的分子。在从头分子设计过程中,强化学习算法也被用来根据新药物的药理特性优化其化学结构,同时出现几种混合方法,整合每种模型的不同方面。
AI驱动的药物发现平台与临床转化合作
Exscientia、Insilico Medicine、Recursion、BenevolentAI和Schrödinger是五家领先的AI衍生药物发现公司,已成功将新型小分子药物候选物推进到临床阶段。Insilico Medicine开发的肺纤维化候选药物rentosertib(ISM001-055)和Exscientia开发的血清素(5-HT1A)受体激动剂DSP-1181,都是通过使用AI驱动平台设计的,随后进入早期临床测试。
2019年,BenevolentAI和阿斯利康联手,使用AI驱动的知识图谱,识别慢性肾病和特发性肺纤维化中的新靶点。总体而言,这些合作伙伴关系表明,药物发现正从孤立的计算创新转向集成流程,在该流程中,AI平台和制药公司共同推动靶点识别、分子设计和临床转化。
挑战与局限性
将AI技术整合到药物设计中相比传统发现方法有几个优势,包括减少时间和成本,以及更好地预测新药的安全性和有效性。然而,缺乏多样化、代表性强和高质量的数据集可能会引入导致不准确预测的偏差。事实上,许多可用的化学和生物数据集不完整,或来自异质实验条件,从而降低了模型的通用性和对新化学结构的适用性。
信任也至关重要,通过开源模型、共享数据集和可解释框架来强调透明度的重要性。然而,AI并不能消除临床开发中的下游失败。Gerstein警告说,一旦确定了有希望的分子,在优化递送、系统效应和安全性方面仍然存在重大挑战。生物复杂性、患者异质性和无法预见的毒性机制持续导致高淘汰率,突显出需要将更强大的生物临床背景整合到AI系统中。
【全文结束】

