蛋白质是由氨基酸分子链组成的,这些分子通过原子间的相互作用形成三维形状。2024年诺贝尔化学奖表彰了德米斯·哈萨比斯(Demis Hassabis)、约翰·詹珀(John Jumper)和大卫·贝克(David Baker),他们利用机器学习解决了生物学最大的挑战之一:预测蛋白质的三维形状并从头设计蛋白质。
今年的奖项特别之处在于,它表彰了一项起源于科技公司的研究:DeepMind,这是一家由谷歌在2014年收购的人工智能研究初创公司。大多数之前的化学诺贝尔奖得主都是学术界的研究人员。许多获奖者后来成立了创业公司,进一步扩展和商业化他们的开创性工作,例如CRISPR基因编辑技术和量子点技术,但这些研究从开始到结束都不是在商业环境中进行的。
尽管物理学和化学的诺贝尔奖分别颁发,但2024年的获奖研究之间存在一个有趣的联系。物理学奖授予了两位计算机科学家,他们奠定了机器学习的基础,而化学奖得主则因使用机器学习解决生物学最大的谜题之一——蛋白质如何折叠——而受到表彰。2024年的诺贝尔奖强调了这种人工智能的重要性,以及当今科学常常跨越传统界限,融合不同领域以取得突破性成果的能力。
蛋白质折叠的挑战
蛋白质是生命的分子机器。它们构成了我们身体的重要部分,包括肌肉、酶、激素、血液、头发和软骨。
了解蛋白质的结构至关重要,因为它们的形状决定了其功能。早在1972年,克里斯蒂安·安芬森(Christian Anfinsen)就因证明蛋白质的氨基酸序列决定了其形状,从而影响其功能而获得了诺贝尔化学奖。如果蛋白质错误折叠,可能无法正常工作,甚至可能导致阿尔茨海默病、囊性纤维化或糖尿病等疾病。
蛋白质的整体形状取决于其组成氨基酸的所有原子之间的微小相互作用,即吸引和排斥。一些原子希望在一起,一些则不希望。蛋白质通过数万个化学相互作用的复杂网络扭曲和折叠成最终形状。
几十年来,基于蛋白质的氨基酸序列预测其形状一直是生物学最大的挑战之一。尽管研究人员现在可以预测形状,但我们仍然不理解蛋白质是如何在几微秒内通过特定的形状来最小化所有原子间相互作用的排斥力的。
为了理解蛋白质的工作原理并防止错误折叠,科学家们需要一种方法来预测蛋白质的折叠方式,但解决这个难题并非易事。
2003年,华盛顿大学生物化学家大卫·贝克编写了Rosetta,这是一种用于设计蛋白质的计算机程序。他展示了可以通过设计蛋白质形状然后预测所需的氨基酸序列来逆向解决蛋白质折叠问题。这是一个巨大的飞跃,但选择用于计算的形状很简单,计算过程也很复杂。要常规设计具有所需结构的新蛋白质,需要一次重大的范式转变。
机器学习的新时代
机器学习是一种人工智能,其中计算机通过分析大量数据来学习解决问题的方法。它已在各个领域得到应用,从游戏、语音识别到自动驾驶汽车和科学研究。机器学习的核心思想是利用数据中的隐藏模式来回答复杂的问题。
这一方法在2010年取得了巨大进展,当时德米斯·哈萨比斯共同创立了DeepMind,这是一家旨在结合神经科学与人工智能解决现实世界问题的公司。
哈萨比斯在4岁时就是国际象棋神童,很快就因其AlphaZero项目而声名鹊起。AlphaZero是一种人工智能,能够自学国际象棋并达到超人类水平。2017年,AlphaZero彻底击败了世界上顶级的计算机国际象棋程序Stockfish-8。AI能够通过自己的游戏过程学习,而不是依赖预编程的策略,这标志着AI领域的一个转折点。
不久之后,DeepMind将类似的技术应用于围棋,这是一种以其极大的复杂性而闻名的古老棋盘游戏。2016年,其AI程序AlphaGo在一场广受关注的比赛中击败了世界顶级选手李世石,震惊了数百万人。
2016年,哈萨比斯将DeepMind的焦点转向了一个新的挑战:蛋白质折叠问题。在约翰·詹珀的领导下,AlphaFold项目启动。团队使用一个大型的实验确定的蛋白质结构数据库来训练AI,使其能够学习蛋白质折叠的原理。结果是AlphaFold2,一种可以从蛋白质的氨基酸序列中预测其三维结构的AI,其准确性令人印象深刻。
这是一个重要的科学突破。自那以后,AlphaFold已经预测了超过2亿种蛋白质的结构,几乎涵盖了科学家迄今为止测序的所有蛋白质。这个庞大的蛋白质结构数据库现已免费提供,加速了生物学、医学和药物开发的研究。
设计蛋白质以对抗疾病
了解蛋白质如何折叠和功能对于设计新药至关重要。酶是一种蛋白质,作为生化反应的催化剂,可以加速或调节这些过程。为了治疗癌症或糖尿病等疾病,研究人员通常会针对疾病途径中特定的酶。通过预测蛋白质的形状,科学家可以确定小分子(潜在的药物候选物)可能与其结合的位置,这是设计新药的第一步。
2024年,DeepMind推出了AlphaFold3,这是AlphaFold程序的升级版,不仅可以预测蛋白质形状,还可以识别小分子的潜在结合位点。这一进展使研究人员更容易设计精确靶向正确蛋白质的药物。
据报道,谷歌在2014年以约5亿美元的价格收购了DeepMind。Google DeepMind现已启动了一项名为Isomorphic Labs的新业务,与制药公司合作,利用这些AlphaFold3预测进行实际药物开发。
大卫·贝克继续在蛋白质科学领域做出重要贡献。他的团队在华盛顿大学开发了一种基于AI的方法,称为“家族范围幻觉”,用于从头设计全新的蛋白质。幻觉是指新的模式,在这种情况下是蛋白质,这些模式是合理的,意味着它们与AI训练数据中的模式相符。这些新蛋白质包括一种发光酶,表明机器学习可以帮助创建从未自然进化过的合成蛋白质。这些AI工具提供了新的方法来设计功能酶和其他蛋白质,这些蛋白质在自然界中是不可能存在的。
AI将开启研究的新篇章
哈萨比斯、詹珀和贝克的诺贝尔奖成就表明,机器学习不仅是一种计算机科学家的工具,它现在已成为生物学和医学未来的重要组成部分。
通过解决生物学中最难的问题之一,2024年诺贝尔奖得主为药物发现、个性化医疗乃至我们对生命化学的理解开辟了新的可能性。
(全文结束)

