摘要
发现新型药物候选分子是药物开发的基础步骤。生成式深度学习模型可以从学习到的概率分布中采样新的分子结构,但其在药物研发中的实际应用取决于能否生成针对特定靶标分子的化合物。我们提出了DrugGEN——一种端到端的生成系统,用于设计与选定蛋白质相互作用的新型候选药物分子。该方法将分子表示为图结构,通过包含图Transformer层的生成对抗网络进行处理。在类药化合物和靶标特异性生物活性分子的大规模数据集上训练后,DrugGEN为AKT1(一种在多种癌症中起关键作用的激酶)设计了候选抑制剂。分子对接和分子动力学模拟表明,生成的化合物能够有效结合AKT1,注意力机制映射揭示了模型的推理逻辑。此外,部分新型分子经过化学合成,实验证实其在体外酶活性检测中可实现低微摩尔浓度的AKT1抑制。这些结果展示了DrugGEN在靶向分子设计中的潜力。通过开放获取的DrugGEN代码库,研究者可利用已知生物活性分子数据集重新训练模型,应用于其他可药靶蛋白。
数据可用性
所有研究资源均为开源。完整训练数据集(包括ChEMBL化合物集、AKT1和CDK2生物活性记录)、每种DrugGEN模型变体的预训练权重文件以及全部结果数据(包括完整的新型生成分子集、分子对接输出表格和MD轨迹分析结果)均归档于DrugGEN数据存储库。相关数据可通过figshare平台获取。
代码可用性
源代码和预训练模型可在GitHub托管仓库中获取。DrugGEN还提供带有图形界面的在线工具,用户可通过指定模型生成新型分子。
【全文结束】