蛋白质对于细胞功能至关重要,每种蛋白质都有其专门的作用。科学家们早已知道蛋白质的结构决定了它的功能。最近,他们发现蛋白质在细胞内的定位同样关键。
细胞内含有用于组织蛋白质的多个隔室。了解蛋白质的位置及其与其他蛋白质的相互作用有助于我们理解其功能,但预测这些信息一直是个挑战。
AlphaFold是一种可以预测蛋白质结构的人工智能工具。麻省理工学院的研究人员,在Richard Young教授的带领下,开发了一种名为ProtGPS的模型,该模型可以预测蛋白质在细胞内的定位以及突变对其定位的影响。ProtGPS还可以设计新蛋白质以靶向特定的细胞区室。
研究人员展示了ProtGPS能够预测蛋白质会定位于12种已知类型的细胞隔室中的哪一种,并判断与疾病相关的突变是否会改变这种定位。他们还创建了一个生成算法来设计新蛋白质以靶向特定隔室。
ProtGPS通过实验室测试进行了验证,弥合了计算设计与实际应用之间的差距。这项研究帮助我们理解蛋白质如何发挥作用,突变如何破坏细胞过程,以及如何设计治疗细胞功能障碍的方法。
麻省理工学院电气工程与计算机科学系AI与健康杰出教授、CSAIL首席研究员Regina Barzilay表示:“能够从计算设计一路到实验室测试这些成果,让我感到非常兴奋。在这个领域的AI论文有很多令人振奋的研究,但其中99.9%从未在真实系统中进行过测试。得益于与Young实验室的合作,我们可以测试并真正了解我们的算法表现如何。”
研究人员使用两组具有已知位置的蛋白质对ProtGPS进行了训练和测试,发现它能准确预测蛋白质的去向。他们还测试了ProtGPS如何预测基于疾病相关突变的蛋白质位置变化。这些突变可能导致疾病,但具体机制往往未知。
了解突变如何导致疾病对于开发疗法至关重要。研究人员怀疑许多与疾病相关的突变可能会改变蛋白质的定位。例如,突变可能阻止蛋白质加入关键隔室。
他们使用ProtGPS分析了超过20万个带有疾病相关突变的蛋白质,预测突变后的蛋白质会去哪里,并测量其与正常位置的变化。显著的变化表明可能存在错位。
研究人员发现许多情况下突变似乎改变了蛋白质的定位。他们在细胞中使用荧光技术测试了20个例子,证实了ProtGPS的预测。这支持了错位可能是疾病被忽视的原因之一的观点,并展示了ProtGPS在理解疾病和寻找新疗法方面的价值。
研究人员希望其他人也能使用ProtGPS,如预测结构模型,以推进蛋白质功能、功能障碍和疾病的研究。
研究人员希望他们的预测模型ProtGPS不仅能预测蛋白质定位,还能设计新蛋白质。目标是创建新的氨基酸序列,使其定位于特定的细胞区室。他们限制算法设计类似于自然界中存在的蛋白质,因为自然界已经通过数十亿年的进化优化了蛋白质序列。
与Young实验室合作,团队测试了他们的蛋白质生成器。该模型表现出色,创造了10种针对核仁的蛋白质。其中四种强烈定位于核仁,其他则显示出一些偏向。
生成功能性蛋白质可以通过设计靶向特定区室的药物来增强药物开发,提高疗效并减少副作用。
研究人员对使用其模型设计具有其他功能的蛋白质感到兴奋,扩大了治疗的可能性。他们认为ProtGPS是理解蛋白质定位和错位在疾病中的作用以及开发新疗法的有前途的工具。
随着这一进步,他们旨在扩展模型的预测能力,测试更多的治疗假设,并设计更多功能性蛋白质以用于各种应用。
(全文结束)

