五年过去,谷歌DeepMind的AlphaFold展现为何科学或是AI的杀手级应用Five years on, Google DeepMind’s AlphaFold shows why science may be AI’s killer app

环球医讯 / AI与医疗健康来源:tech.yahoo.com美国 - 英语2025-12-05 21:45:20 - 阅读时长7分钟 - 3169字
谷歌DeepMind的AlphaFold问世五年来彻底革新了生物化学研究领域,该AI模型能高精度预测蛋白质结构,已从最初解析18万种蛋白质扩展到2.4亿种,涵盖人类致病关键蛋白;其团队获2024年诺贝尔化学奖,证明科学或是AI最具价值的应用场景,目前全球超330万人使用该工具加速药物研发、破解心脏病机制及蜜蜂种群崩溃等难题,虽在药物发现领域的实际影响尚待验证,但AlphaFold3等衍生模型正推动蛋白质互作预测和新型药物设计,彰显AI在解决人类健康与生命科学根本问题上的不可替代性。
AlphaFold蛋白质结构预测药物研发疾病研究AI科学应用蛋白质折叠新冠疟疾恰加斯病高胆固醇治疗基因治疗生物化学家
五年过去,谷歌DeepMind的AlphaFold展现为何科学或是AI的杀手级应用

谷歌DeepMind联合创始人兼首席执行官德米斯·哈萨比斯与公司高级研究员约翰·詹珀因开发AlphaFold——一种能预测蛋白质结构的AI模型——共同获得2024年诺贝尔化学奖。自AlphaFold问世五年来,该AI模型已彻底改变了生物化学家的工作方式。

当众多企业仍在寻找AI的杀手级应用时,生物化学家早已找到答案:蛋白质折叠。本周标志着谷歌DeepMind开发的AlphaFold 2问世五周年,该AI系统能根据DNA序列高精度预测蛋白质结构。

五年间,AlphaFold 2及其后续AI模型已成为生化研究中几乎与显微镜、培养皿和移液管同等基础且普遍的工具。这些模型开始改变科学家寻找新药的方式,有望实现更快速、更成功的药物研发,并助力科学家解决从海洋污染到培育抗气候变化作物等广泛问题。

“其影响远超我们所有预期,”领导谷歌DeepMind蛋白质结构预测团队的高级科学家约翰·詹珀向《财富》杂志表示。2024年,詹珀与谷歌DeepMind联合创始人兼首席执行官德米斯·哈萨比斯因开发AlphaFold 2共享诺贝尔化学奖。

如今,全球许多研究生阶段的生物学课程已将使用AlphaFold进行蛋白质结构预测作为标准工具教学。“这已成为分子生物学家培训的必备内容,”詹珀说。

《财富》曾在2020年专题报道中记录了谷歌DeepMind攻克“蛋白质折叠问题”的历程。蛋白质具有复杂物理形态,AlphaFold问世前,描述这些形态需耗时费力的实验室实验。

该公司最终通过Transformer技术解决该问题——这与ChatGPT等流行聊天机器人的AI引擎相同。但区别在于:Transformer并非针对文本训练以输出最可能的下一个词,而是基于蛋白质DNA序列数据库、已知蛋白质结构及共同进化的DNA序列信息(这为结构提供线索)进行训练,进而预测蛋白质结构。

“有时我不得不掐自己确认:天啊,它真的成功了。我们本可能以无数种方式失败,”谷歌DeepMind研究副总裁普什米特·科利表示。科利领导公司AI应用于科学的努力,他同时指出AlphaFold证明AI不仅能为科技公司创造巨额利润,更能推动科学进步并最终造福人类。“AlphaFold真正验证了核心理念:如果我们开发这项人工智能技术,人类最值得将其用于何处?我认为科学是AI最完美的应用场景。我不会说这是唯一用途,但绝对是最具说服力的。”

从18万种蛋白质结构到2.4亿种

蛋白质是由氨基酸组成的长链,作为生命引擎调控大多数生物过程。蛋白质功能取决于其形状:细胞生成蛋白质时,氨基酸会自发折叠成缠绕扭曲的结构,形成凹槽、凸起甚至长尾。

化学与物理定律决定这种折叠方式。因此,1972年诺贝尔化学奖得主克里斯蒂安·安芬森提出:DNA应完全决定蛋白质最终结构。这一非凡猜想提出时,人类尚未完成任何基因组测序。但安芬森理论催生了计算生物学的子领域,旨在用复杂数学模型(而非实验证)模拟蛋白质。问题在于,可能的蛋白质结构数量超过宇宙原子总数,即使使用高性能计算机建模也极其困难。

AlphaFold 2问世前,科学家只能通过少数昂贵冗长的实验流程确定蛋白质结构,此前仅解析约18万种蛋白质结构。其他计算机预测方法准确率仅50%,且生化学家无法提前判断预测可信度。AlphaFold 2问世后,已有超2.4亿种蛋白质结构获得预测,涵盖人体所有蛋白质及新冠、疟疾、恰加斯病等关键人类疾病相关蛋白。

谷歌DeepMind向研究人员免费开放AlphaFold 2下载权限,同时建立基于互联网的服务器——研究者可上传蛋白质DNA序列获取结构预测。该公司还创建了几乎所有已知蛋白质的结构预测,并存入位于英国剑桥外的欧洲分子生物学实验室欧洲生物信息学研究所数据库。

迄今,全球超330万人使用过AlphaFold 2。原始AlphaFold研究已被4万余篇学术论文直接引用,其中30%聚焦各类疾病研究。有研究指出该AI模型已直接或间接促成约20万项科研成果发表,工具还出现在400余项成功专利申请中。

詹珀向《财富》表示,最令他欣慰的是科学家利用AlphaFold发现“原本不知从何找起”的生命过程关键线索。例如,近期科学家借助AlphaFold帮助发现了一种此前未知的蛋白质复合体,该复合体对精子使卵子受精至关重要。

发现精子表面该蛋白的维也纳分子病理学研究所生物化学家安德烈亚·保利向《自然》杂志表示,团队“每个项目都使用AlphaFold 2,因为它能加速发现”。

从心脏病到蜜蜂:解锁生命奥秘

AlphaFold参与的重大发现包括解析低密度脂蛋白(LDL)核心关键蛋白的结构——LDL俗称“坏胆固醇”,是心脏病的主要诱因。这种名为apoB100的蛋白因体积庞大且与其他蛋白相互作用复杂,此前无法绘制结构。但密苏里大学的两位科学家将低温电子显微镜成像技术与AlphaFold预测结合,成功解析其结构,这可能助力科学家开发更好的高胆固醇治疗方案。

其他科学家利用AlphaFold发现了卵黄原蛋白的结构,该蛋白在蜜蜂免疫系统中起关键作用。了解其结构或有助于科学家破解全球蜜蜂种群崩溃之谜,并设计基因改造以培育抗病性更强的蜜蜂品种。

AlphaFold预测的整体准确率因蛋白类型而异,但系统会提供置信度评分,帮助科学家判断特定区域预测的可靠性。对人类蛋白质,约36%的预测为高置信度;对大肠杆菌,高置信度比例达73%。某些蛋白存在“内在无序区域”,其形状随周围物质大幅变化。无论是实验成像方法还是AI模型,均难以准确预测这些无序区域形态。(2024年谷歌DeepMind推出的更强大AI模型AlphaFold 3有时能预测这些区域如何与其他蛋白或分子结合,但并非总是有效。)

AlphaFold对药物发现的实际影响尚待验证

AlphaFold最终可能对药物发现产生重大影响,但目前难以评估其实际贡献。科学家曾利用AlphaFold找到两种现有FDA批准药物,可重新用于治疗恰加斯病——这种热带寄生虫病每年感染700万人,导致超1万例死亡。

詹珀表示,AlphaFold 2的后续模型可能比原始结构预测工具更直接参与药物发现。例如AlphaFold 3不仅能预测蛋白质结构,还能预测蛋白质间及与小分子结合的关键细节——这至关重要,因为多数药物是通过结合蛋白靶点改变功能的小分子,或本身就是蛋白质。同时,AlphaFold Multimer(AlphaFold 2的扩展版)可预测蛋白质相互作用,助力药物设计。

谷歌DeepMind分拆成立姐妹公司Isomorphic,正利用AlphaFold 3等工具设计药物。该公司已与诺华和礼来达成合作,但尚未公开研发中的候选药物。AlphaFold 3向学术研究者免费开放,但Isomorphic和谷歌以外的商业实体不得使用该软件。

谷歌DeepMind还开发了能设计具有特定结合特性的新型蛋白质的AI模型AlphaProteo,以及可预测单点基因突变危害性的AlphaMissense系统。后者或帮助科学家理解多种疾病根源并寻找潜在疗法,包括基因治疗。

詹珀表示,他个人正探索大语言模型(如谷歌Gemini AI)能否在科学中发挥作用。部分AI初创公司已尝试开发让科学家指定蛋白质功能后输出DNA配方的LLM(仍需实验验证)。但詹珀对此类LLM设计全新蛋白质的能力持保留态度,并称有人创建的AlphaFold聊天机器人前端“并不有趣”。

相反,他更期待利用LLM的强大能力生成新假设并设计验证实验。DeepMind已基于Gemini开发出能执行部分任务的“AI科学家”原型,但詹珀认为该概念潜力巨大。“真正令人兴奋且庞大的数据集是全部科学文献,”他说。

【全文结束】

大健康

猜你喜欢

  • 精神疾病中的认知功能障碍:一个被忽视的领域精神疾病中的认知功能障碍:一个被忽视的领域
  • 英国生物银行推进群体规模蛋白质组学研究英国生物银行推进群体规模蛋白质组学研究
  • 新诊断与治疗方法:关键蛋白为肌萎缩侧索硬化症和痴呆症指明方向新诊断与治疗方法:关键蛋白为肌萎缩侧索硬化症和痴呆症指明方向
  • AI与政策改革将重塑英国药物研发格局AI与政策改革将重塑英国药物研发格局
  • 医疗保健中的人工智能(第二辑):人工智能对预防性医疗的影响医疗保健中的人工智能(第二辑):人工智能对预防性医疗的影响
  • 基因发现揭示谵妄隐藏风险通路基因发现揭示谵妄隐藏风险通路
  • 从创意到影响从创意到影响
  • 基因与DNA揭示格陵兰心脏病风险上升的原因基因与DNA揭示格陵兰心脏病风险上升的原因
  • 科学家揭示脑酶OTULIN如何控制tau蛋白表达科学家揭示脑酶OTULIN如何控制tau蛋白表达
  • 学校疫苗接种率引发家长和医疗专业人士担忧学校疫苗接种率引发家长和医疗专业人士担忧
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康