杜克大学的研究人员开发了一种基于AI的平台,该平台可以设计短蛋白质(称为肽),这些肽能够结合并摧毁以前被认为不可成药的致病蛋白。这项工作受到了OpenAI图像生成模型的启发,新的算法可以快速优先选择肽进行实验测试。
这项研究于1月22日发表在《科学进展》杂志上。
一种治疗疾病的方法是开发能够特异性靶向并摧毁驱动疾病的蛋白质的疗法。有时,这些关键蛋白质具有明确的结构,就像整齐折叠的折纸鹤,因此传统的分子疗法可以轻松与其结合。但超过80%的致病蛋白更像一团乱麻——无序且纠缠不清,这使得标准疗法难以在其表面找到一个口袋来附着并发挥作用。
为了绕过这一问题,研究人员探索了如何使用肽来结合并降解致病蛋白。由于肽是蛋白质的小版本,它们不需要表面口袋即可结合。相反,它们可以与蛋白质中的各种氨基酸序列结合。但即使这些方法也有局限性,现有的“现成”结合剂并未设计用于附着到不稳定或过于纠缠的蛋白质结构上。尽管科学家们一直在努力开发新的结合蛋白,但这些方法仍然依赖于目标蛋白质的三维结构信息,而这些信息对于无序的目标是不可用的。
杜克大学生物医学工程助理教授Pranam Chatterjee及其团队从生成式大语言模型(LLM)中汲取灵感,创建了解决方案。其成果名为PepPrCLIP,即通过CLIP进行肽优先级排序。该工具的第一个组件PepPr使用经过大量天然蛋白质序列训练的生成算法来设计具有指定特征的新“引导”蛋白质。CLIP是该平台的第二个组件,它利用最初由OpenAI开发的算法框架,将图像与相应的标题匹配,以测试和筛选哪些肽能与目标蛋白质匹配。在这里,CLIP模型仅需目标序列。
“OpenAI的CLIP算法将语言与图像连接起来。如果你有文本写着‘狗’,你应该得到一张狗的图片。”Chatterjee说,“我们不是将语言与图像匹配,而是训练它将肽与蛋白质匹配。PepPr制造肽,我们的适应性CLIP算法会筛选这些肽,并告诉我们哪些肽能很好地匹配。”
在与RFDiffusion(一种使用目标三维结构生成肽的现有平台)的比较中,PepPrCLIP更快,并且几乎总是能设计出与目标蛋白质更好的匹配肽。为了评估PepPrCLIP在有序和无序蛋白质靶标上的表现,Chatterjee和他的实验室与来自杜克大学医学院、康奈尔大学和桑福德伯纳姆普雷比斯医学发现研究所的研究团队合作进行了实验测试。
在第一次测试中,研究团队展示了PepPrCLIP生成的肽能够有效结合并抑制UltraID的活性,UltraID是一种相对简单且稳定的酶蛋白。接下来,他们使用PepPrCLIP设计了可以附着到β-catenin上的肽,β-catenin是一种涉及多种癌症信号传导的无序且复杂的蛋白质。团队生成了六种CLIP指示可以结合到该蛋白质的肽,并证明其中四种能够有效结合并降解目标。通过摧毁该蛋白质,他们可以减缓癌细胞的信号传导。
在最复杂的测试中,团队设计了可以结合到与滑膜肉瘤相关的一种高度无序蛋白质的肽。滑膜肉瘤是一种罕见且侵袭性的癌症,主要影响儿童和年轻人。据Chatterjee描述:“这种蛋白质就像一碗意大利面,它是世界上最无序的蛋白质。”
团队测试了10种设计,将肽引入滑膜肉瘤细胞。他们观察到PepPrCLIP设计的肽既能结合也能降解蛋白质,正如它在较简单的靶标上所做的那样。如果他们能够摧毁该蛋白质,就有机会开发出针对以前不可成药癌症的新疗法。
除了计划继续改进他们的平台外,Chatterjee和他的团队还计划与医疗和行业专业人士合作,开始为由不稳定蛋白质引起的疾病(如致命的神经疾病亚历山大氏病和不同类型癌症)创造可能用于新疗法的肽。
“这些复杂的无序蛋白质使许多癌症和疾病实际上变得不可成药,因为我们无法设计出能与它们结合的分子。”Chatterjee说,“但PepPrCLIP表明它可以作用于最复杂的蛋白质,这为我们打开了许多令人兴奋的临床可能性。”
(全文结束)

