蛋白质可能远比我们想象的更为坚固。最新研究表明,只有少数关键氨基酸对蛋白质核心结构起决定性作用,这一发现为更快速、更高效且更可靠的蛋白质设计打开了新窗口。该研究近日发表于《科学》杂志。
蛋白质是驱动生命体无数生物过程的核心分子机器。它们既能将光能转化为化学能,也能通过对抗病毒支持免疫系统,功能极其多样。每种蛋白质都由20种不同氨基酸组成的链状结构构成,即便是仅包含60个氨基酸的短链蛋白质,其理论组合方式可达10^80种——这个数字与可观测宇宙中的原子总数相当。
这种指数级的复杂性引发了一个根本性问题:进化过程如何从海量组合中筛选出能正确折叠、稳定存在并执行关键功能的氨基酸序列?科学家们同时探索着这些进化规律能否被现代研究者利用,以开发更有效的药物和环保催化剂。
蛋白质内部存在紧密堆积的核心区域和负责分子交互的表面区域。传统认知认为改变核心氨基酸如同拆除建筑承重梁,单个突变就可能导致结构坍塌。由于核心氨基酸高度紧密的排列特性,小范围的改动可能引发连锁反应,破坏整个蛋白质构象。
但这项研究颠覆了传统认知。巴塞罗那基因组调控中心(CRG)和英国剑桥威康桑格研究所的研究团队,对人类FYN-SH3蛋白结构域进行了系统性研究。他们构建了数十万个变异体并测试其折叠和功能表现,结果发现SH3结构域在数千种不同核心/表面组合中仍能保持结构和功能完整,其核心区域仅存在极少数真正起承重作用的氨基酸。
"我们的数据挑战了蛋白质如同纸牌屋般脆弱的传统认知。其稳定性规则更像乐高积木而非叠叠乐,单个元件的改变触发整体崩塌的现象极为罕见且可预测。"研究第一作者、CRG博士后研究员Albert Escobedo解释道。
研究团队利用实验数据训练机器学习模型,开发出可预测SH3序列稳定性的工具。当测试涵盖51,159个自然存在的SH3序列(跨度覆盖细菌到人类)时,模型成功识别了几乎所有稳定序列,即使测试序列与人类版本的同源性低于25%。
这项发现将显著提升蛋白质工程效率。当前制药公司筛选数万蛋白质变体时通常采取保守渐进策略,导致新酶、药物和疫苗开发周期漫长且成本高昂。新方法确认蛋白质稳定性遵循更简单规则后,可大幅减少试错环节,使研究人员能通过计算机建模直接设计包含数十处突变的创新方案。
研究通讯作者、CRG/威康桑格双聘教授Ben Lehner指出:"预测和模拟蛋白质进化的能力,将推动工业级生物设计,挑战传统蛋白质工程的保守范式。这对开发长效药物、环保催化剂等应用具有变革意义。"
该研究揭示的生命系统折叠规律,为蛋白质设计提供了新的理论框架。正如Escobedo所说:"进化并非在宇宙级规模的序列空间中盲目筛选,蛋白质折叠的生化法则构建了一个广阔且包容的选择平台。"
【全文结束】

