基于药效团引导的新型类药分子生成式设计Pharmacophore-Guided Generative Design of Novel Drug-Like Molecules

环球医讯 / 创新药物来源:arxiv.org俄罗斯 - 英语2025-10-03 22:43:09 - 阅读时长8分钟 - 3706字
本研究提出创新的药效团引导生成式框架,在保持与参考化合物(如FDA批准药物)高药效团相似性的同时提升结构新颖性,以乳腺癌雌激素受体调节剂为案例验证了方法的有效性。生成的分子展现出优异的药物特性与专利潜力,其药物相似性定量评估值提升至0.59,合成可及性显著改善,且100%具备结构新颖性,为人工智能驱动的药物发现提供高效可解释的解决方案,有望加速先导化合物优化并突破传统分子对接计算的高成本瓶颈,同时确保生成分子符合药物研发的实际需求。
新型类药分子生成药效团引导乳腺癌雌激素受体抑制剂类药性合成可及性结构新颖性生物活性评估奖励函数对接评分化学空间探索
基于药效团引导的新型类药分子生成式设计

摘要

人工智能在早期药物发现中的应用为探索化学空间和加速先导化合物优化提供了前所未有的机遇。然而,在生成模型训练中使用分子对接作为奖励函数计算成本高昂且可能产生不准确结果。本文提出一种新型生成框架,在参考化合物的药效团相似性与活性分子的结构多样性之间取得平衡。该框架允许用户提供自定义参考集(包括美国食品药品监督管理局批准的药物或临床候选物),指导潜在治疗分子的从头生成。通过针对乳腺癌雌激素受体调节剂和拮抗剂的案例研究,我们验证了其适用性。生成的化合物在保持与已知活性分子高药效团保真度的同时,引入了显著的结构新颖性,表明其具有强大的功能创新和专利潜力。对生成分子与常见类药特性的综合评估证实了该方法的稳健性和药物研发相关性。

1 引言

人工智能在早期药物发现中的整合正在变革制药范式,实现更高效的化学空间探索并加速先导化合物优化进程。传统评估生物活性的方法是分子对接计算,该方法预测配体与其靶标蛋白的结合亲和力。然而,当迭代执行时,该方法计算成本高昂且常产生不可靠的评分。此外,它常过度简化复杂相互作用,导致准确性不足。许多评分函数基于线性能量组合,可能无法充分捕捉蛋白质-配体相互作用的细微差别,导致与实验结合亲和力的相关性较差。

药效团引导方法提供了引人注目的替代方案:通过聚焦关键相互作用特征的空间排列(如氢键供体/受体、芳香或疏水基团),它们为不同化学支架上的生物活性提供了更具可解释性和稳健性的代理指标。已有研究探索了药效团感知相似性度量和潜在空间方法,但很少有方法在种子片段中将药效团级相似性与结构多样性相结合,同时显式优化对接性能。现有框架(如DrugMetric)使用基于变分自编码器的化学空间距离进行分子生成和支架多样性优化;其他方法专注于分子潜在空间的生成建模(如NP-VAE、条件β-VAE),虽获得高新颖性评分,但常牺牲对接保真度或药效团一致性。

本研究提出一种从头分子生成框架,通过最大化与参考化合物(如FDA批准药物)的药效团相似性,同时最小化结构相似性以提升新颖性和潜在专利性。我们通过针对乳腺癌雌激素受体抑制剂的案例研究,验证了该方法的效用。生成的化合物在保持高结构多样性的同时,展现出与已知降解剂强烈的药效团一致性,并通过对接评分和合成可及性进一步验证。本研究使用的代码和数据将在稿件最终版中发布于GitHub。

2 相关工作

近期研究提出了多种药效团感知分子生成框架。Zhu等人开发了PGMG——一种受药效团约束引导的图生成模型,实现了高有效性、新颖性和对接评分。Seo和Kim提出了PharmacoNet自动化管道,用于药效团模型构建和评分,在保持高精度的同时加速虚拟筛选。Yu等人提出DiffPhore扩散模型,学习基于药效团地图生成分子并预测结合构象,无需显式对接。Moyano-Gómez等人开发了O-LAP,通过创建填充空腔的伪配体改善对接重评分,兼顾蛋白质-配体形状互补性。Alakhdar等人引入PharmaDiff药效团条件扩散模型,生成满足3D特征约束的分子并提升对接性能。

现有方法常优化对接评分或依赖特定结合口袋,而本框架具有靶标无关性和对接独立性,使用药效团相似性作为生物相关性的代理指标。与PGMG和PharmaDiff不同,它在支架新颖性与药效团保真度间取得平衡;与O-LAP和PharmacoNet不同,它避免预定义结合位点,使在结构数据缺失时仍可进行早期探索。这使我们能够访问多样化的可专利化学空间,同时保留与生物活性相关的药效团模式。

3 实验

3.1 框架概述

我们提出一种新型分子生物活性评估方法,该方法整合了针对预定义参考化合物集的结构和药效团相似性评估。该方法已集成至强化学习模型FREED++的奖励函数中。在强化学习的每个周期中,生成的分子通过两种不同分子表示进行编码:捕捉药效团模式的CATS(化学高级模板搜索)描述符和代表亚结构特征的MACCS(分子访问系统)指纹。为计算相似性,将生成结果与用户提供的参考集分子表示进行比较。鉴于两种表示的本质差异,采用不同相似性度量:

  • 药效团相似性:基于连续值CATS描述符,使用余弦相似性和欧氏距离量化
  • 结构相似性:基于二进制MACCS指纹,使用Tanimoto系数评估;而MAP4(四键内最小哈希原子对指纹)通过结合原子对关系与环状结构提供更具表现力的表示,得分更高

奖励函数被明确设计为同时最大化药效团相似性和最小化与参考分子的结构相似性。这种双目标优化对生成可能保留所需生物活性(由药效团重叠引导)同时具有足够结构新颖性以增强专利潜力的化合物至关重要。

3.2 基线评估

作为参考点,我们将QED评分与使用QVina的对接模拟相结合。对接使用雌激素受体α的晶体结构(PDB ID: 8AWG)执行。选择该靶标因其在乳腺癌发病机制中的核心作用及高分辨率验证结构的可用性。

3.3 奖励函数变体

如3.1小节所述,药效团相似性使用余弦和欧氏距离评估。余弦相似性评估向量方向,广泛用于分子指纹;欧氏距离捕捉幅度和方向,提供差异性的互补度量。结构相似性使用Tanimoto系数和MAP4评估。我们测试了奖励函数的四种配置:

  1. QED + Tanimoto + 欧氏相似性
  2. QED + Tanimoto + 余弦相似性
  3. QED + MAP4 + 欧氏相似性
  4. QED + MAP4 + 余弦相似性

3.4 附加特性分析

生成分子通过正交过滤器进一步评估。合成可及性(SA)评分估计实际可行性,新颖性通过检查ChEMBL、ZINC和PubChem数据库缺失情况量化。最后,我们分析了QED、对接评分及分子特性的分布,包括SA、MAP4、Tanimoto以及通过欧氏和余弦度量评估的药效团相似性。

4 结果与讨论

4.1 药效团与类药性综合评估

不同奖励配置下生成分子的评估突显了该框架优化药效团相似性和预测结合亲和力的能力(表1)。基线分子(无药效团奖励生成)显示相对良好的预测结合亲和力(对接评分-8.65)和完全新颖性(100%),但类药性较低(QED 0.30)。尽管获得更有利的对接评分,基线生成分子与已知药物的药效团相似性极低,引发对其生物相关性的担忧,且合成可及性存疑(SA评分6.28)。

引入药效团相似性和结构多样性的奖励函数(配置1-4)改善了分子特性,药效团引导配置下的QED值和SA评分均提升。这表明强制药效团保真度促使生成更具类药性和合成可及性的分子。不同相似性度量对这些特性分布的影响在图2中直观呈现:QED分布(图2a)基线集中在0.3-0.4,而MAP4 + 余弦相似性将其推向更高值(峰值0.6-0.7);SA分布(图2c)显示其他方法峰值低于基线(峰值4),表明合成可及性改善。对接评分分布(图2b)所有配置均向较低负值偏移(峰值约-8),但已知雌激素受体调节剂的平均对接评分为-6.64,表明所有四种配置在结合亲和力上实际与已验证调节剂相当。此外,MAP4 + 余弦相似性(图2f)的余弦相似性高于Tanimoto + 余弦相似性(峰值0.7),表明前者生成结构具有更高的平均余弦相似性评分。

MAP4提供丰富的分子表示,编码原子对关系并利用最小哈希高效捕捉全局拓扑和局部特征。所有奖励配置下的药效团和结构相似性值保持可比性,表明该框架生成具有优异预测结合亲和力、类药性和结构新颖性的分子。

图3中代表性生成分子及其参考类似物(每种奖励设置一个)重现了关键药效团模式——具有相似连接长度的三芳基/杂芳基基序,同时重塑支架。尽管对接评分改善主要体现在MAP4 + 余弦配置中,但顶级分子的QED高于参考降解剂。

这些结果表明,我们的奖励函数推动生物有意义的药效团排列(芳基三联体、保守氢键向量、疏水间隔基)的收敛,而不会坍缩为紧密结构类似物,在功能相似性和支架新颖性间取得平衡。

4.2 方法学局限性

本研究存在若干方法学局限。尽管生成分子对已知降解剂表现出高药效团相似性,但其对接评分和QED仅中等。当前方法采用受限的药效团描述符集和相似性度量,可能固有地限制生成分子支架的多样性。需要强调的是,本工作并非提议替代对接模拟;而是建议在后续阶段将其用于筛选输出,而非集成到生成奖励函数中。未来研究将通过整合替代药效团表示、附加相似性度量和更多样化生成模型来扩展此框架,以同步提升生物相关性和化学新颖性。作为初步研究,本工作为显著的进一步开发和精炼奠定基础,最终通过合成和生物测定实现实验验证。

5 结论与未来工作

我们提出一种药效团引导生成方法,用于设计潜在活性和选择性分子。药效团相似性使用CATS描述符通过欧氏和余弦度量评估,而结构新颖性通过基于MACCS描述符最小化相似性实现(使用经典Tanimoto系数和新提出的MAP4度量)。在针对乳腺癌雌激素受体抑制剂的案例研究中,生成化合物对已知活性分子表现出高药效团相似性和低结构相似性,表明其具有强大新颖性和专利潜力。所有分子均满足基本类药标准,支持该方法进一步开发和实验验证的潜力。

【全文结束】

大健康

猜你喜欢

  • 新软件工具助力科学家高效解析组织复杂空间数据新软件工具助力科学家高效解析组织复杂空间数据
  • 重新编程生物催化剂生成新型药物分子库重新编程生物催化剂生成新型药物分子库
  • 彼得森健康技术研究所发布阿片类药物使用障碍数字健康技术评估结论彼得森健康技术研究所发布阿片类药物使用障碍数字健康技术评估结论
  • 西南研究院开发新型离子辅助色谱技术加速药物研发西南研究院开发新型离子辅助色谱技术加速药物研发
  • 催化剂驱动的新型分子骨架获取方法助力药物发现催化剂驱动的新型分子骨架获取方法助力药物发现
  • 药物对肠道微生物组产生长期影响药物对肠道微生物组产生长期影响
  • 原子交换实现吲哚一锅法转化为苯并咪唑加速药物研发原子交换实现吲哚一锅法转化为苯并咪唑加速药物研发
  • 通过链接预测和网络嵌入发现新的药物-靶点相互作用通过链接预测和网络嵌入发现新的药物-靶点相互作用
  • 新型可持续制药方法有望大幅降低处方药成本新型可持续制药方法有望大幅降低处方药成本
  • 研究发现常见药物停用数年后仍对肠道留下持久印记研究发现常见药物停用数年后仍对肠道留下持久印记
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康