AI助力蛋白质工程加速发展Turbocharging Protein Engineering with AI

环球医讯 / AI与医疗健康来源:cns.utexas.edu美国 - 英语2024-09-26 05:00:00 - 阅读时长9分钟 - 4138字
德克萨斯大学奥斯汀分校的新Deep Proteins团队利用人工智能技术在蛋白质工程领域取得了重大突破,加速了从治疗药物到农业化学品等多领域的应用开发。
AI助力蛋白质工程DeepProteins团队德克萨斯大学蛋白质结构预测AlphaFold治疗药物蛋白质工程应用生物技术发展人工智能与蛋白质工程健康访问
AI助力蛋白质工程加速发展

德克萨斯大学(UTas)的新Deep Proteins团队正在借助人工智能技术改变生物技术的发展。研究人员在TACC可视化实验室的巨大视频显示屏上研究分子的三维结构。

作为一名在休斯顿工作的化学家,丹尼·迪亚兹(Danny Diaz)花费了很多时间在穿越城市的交通中思考如何加快他的研究进度。“我意识到,短期内我的影响将受限于我能亲手进行多少化学实验。”他回忆道。他意识到,通过软件工程和数据分析,他可以随时运行虚拟实验,甚至在他睡觉或旅行时也能进行。这些结果可以帮助他绕过实验室中常见的试错过程。当他带着这种思维方式进入德克萨斯大学奥斯汀分校的化学研究生项目时,他与其他世界各地的研究人员一起站在了一个新的起点,他们开始开发雄心勃勃的新方法来设计用于各种有用应用的蛋白质,包括治疗药物、农用化学品、食品添加剂以及分解塑料废物的酶。其中最令人期待的应用之一是用于治疗癌症、自身免疫疾病、罕见代谢障碍、阿尔茨海默病、传染病等疾病的治疗药物。由于传统的方法开发蛋白质作为治疗药物既缓慢又昂贵,且充满失败的风险,这一领域已经准备好迎接颠覆性的变革。

2020年,当迪亚兹还是二年级博士生时,谷歌的DeepMind团队发布了AlphaFold的第二版,这是一个强大的人工智能工具,可以根据氨基酸序列预测任何给定蛋白质的三维形状。预测这些蛋白质结构是生物学领域几十年来的重大挑战,尽管模型的预测并不完美,但后续的改进使其几乎解决了这个问题。AlphaFold成功的关键在于一种新的构建AI模型的范式——变压器架构,这也是生成式AI工具如ChatGPT的基础。大多数人将其视为生成有用文本的方式,但生物学和化学领域的研究人员很快意识到,变压器模型也可以应用于设计基于蛋白质的生物技术。AlphaFold使迪亚兹的许多研究项目成为可能,他利用它训练没有实验数据支持的蛋白质结构的AI模型。

丹尼·迪亚兹共同领导了Deep Proteins小组,该团队隶属于德克萨斯大学奥斯汀分校的机器学习基础研究所(IFML),该研究所由美国国家科学基金会资助。

蛋白质规划

你可能还记得高中生物学课程中提到,蛋白质是由像项链上的珠子一样串联在一起的氨基酸组成的。氨基酸的确切顺序,即蛋白质序列,决定了它的三维形状及其功能。然而,蛋白质序列的潜在变化比宇宙中的星星还要多,大多数这些变化都是不稳定的或无功能的。这使得在实验室中测试这些变化以找到改进的、高功能的蛋白质极其困难。要使蛋白质在健康和医学应用中变得有用,通常需要通过基因工程引入变异,以便蛋白质可以用作疫苗、抗癌药物或生物制造产品。识别优化蛋白质的突变非常困难,因为这通常依赖于科学家利用科学文献中关于特定蛋白质的稀缺数据来指导他们的直觉。这时,人工智能就派上了用场。理想的情况是,AI模型可以从广泛的数据源中学习,然后更快地引导研究人员设计出更好的方案。例如,分子生物科学系的安德鲁·埃林顿教授(Andrew Ellington)很早就邀请迪亚兹参与一个项目,探索利用机器学习加速蛋白质工程的繁琐过程。该项目被称为MutCompute,是早期的例子之一,展示了AI如何缩小搜索空间,调整蛋白质,使其更稳定、更容易生产或更准确地命中目标。由此产生的AI模型帮助实现了塑料降解酶的重大突破。

如今,迪亚兹已经成为德克萨斯大学奥斯汀分校计算机科学系的一名研究科学家,他共同领导了Deep Proteins小组,该团队隶属于德克萨斯大学奥斯汀分校的机器学习基础研究所(IFML),该研究所由美国国家科学基金会资助。除了IFML主任兼Deep Proteins共同负责人亚当·克利万斯(Adam Klivans)外,迪亚兹和其他研究人员还与实验科学家合作,在德克萨斯大学及其他合作伙伴机构(包括休斯顿卫理公会研究所、明尼苏达大学和康奈尔大学)的实验室中生产和测试AI设计的蛋白质。“德克萨斯大学在这个领域的一个特别之处在于,我们将世界一流的AI研究人员与世界一流的生物化学科学家联系起来,以加速生物技术的发展,这一切都在同一个屋檐下进行。”克利万斯说,“Deep Proteins旨在从一开始就跨学科发展,开发具有实际应用前景的基础蛋白质AI工具。”

Deep Proteins的研究人员借鉴了许多学科的经验,例如,开发了一种名为EvoRank的AI技术,该技术训练AI模型从自然界蛋白质进化的记录中学习,以预测进化上合理的新型突变。“我们想知道,能否从自然产生这种多样性的基本规则中学习?”迪亚兹说,“一旦这些规则被AI模型学会,我们就可以在计算机上过滤掉那些杀死蛋白质的突变,从而在实验室中专注于那些不会杀死蛋白质的突变,从而加速开发新的基于蛋白质的生物技术。”

一种最初从植物中提取并用作阿尔茨海默病药物的酶经过重新设计,提高了产量和催化活性。

蛋白质超能力

为了开发具有商业可行性的药物,研究人员需要赋予蛋白质一些“超能力”,其中之一就是能够在短时间内大量、快速且经济地生产。与安德鲁·埃林顿教授(Andrew Ellington)、杰西·张教授(Jessie Zhang)等人合作,Deep Proteins研究人员使用AI模型实现了这一点。对于一种传统上从水仙花中提取的阿尔茨海默病药物,这是一个成本高昂且耗时的过程,容易受到不可预测的生长条件的影响。他们更新了之前用于塑料降解酶的模型,扩展到蛋白质中与小分子和维生素相互作用的区域。“蛋白质不是孤立存在的。”迪亚兹说,“它们存在于与其他蛋白质、RNA、DNA、维生素、矿物质、脂肪、糖类和其他小分子混合的汤中。因此,至关重要的是,AI不仅要了解蛋白质化学,还要了解所有生物化学。”

在MutComputeX的指导下,他们改造了大肠杆菌(E. coli),使其能够生产阿尔茨海默病药物加兰他敏的前体,使其能够在实验室中更便宜、更可靠地生长。

提高产量也是Deep Proteins小组与研究副教授埃弗里特·斯通(Everett Stone)实验室合作的一个关键目标。该努力旨在寻找一种高度依赖于一种名为丝氨酸的关键代谢物的乳腺癌治疗方法。从一种天然分解丝氨酸的人类酶开始,研究人员使用他们的AI模型开发了一个更稳定的版本,其产量是天然版本的七倍。他们已经为这个版本申请了专利,目前正在进行动物试验。另一个有用的“超能力”是蛋白质能够更紧密地结合目标,这被称为结合亲和力。这通常意味着它在执行任务时更有效,例如,当抗体结合到病毒表面的蛋白质并阻止其感染细胞时。在与休斯顿卫理公会研究所的吉米·戈利哈尔(Jimmy Gollihar)合作中,迪亚兹使用MutComputeX大幅提高了两种针对导致COVID-19的病毒的抗体的结合亲和力。

对于疫苗来说,另一个特别有用的“超能力”是稳定性,即在制造和运输过程中以及注射到体内后面对温度或化学变化时保持其形状的能力。一些病毒表面有蛋白质,使它们能够感染细胞,并且擅长逃避免疫系统,因为它们会改变形状。为了产生最佳的免疫反应,基于这些病毒蛋白的疫苗必须锁定它们在感染细胞之前的典型形状。这是德克萨斯大学奥斯汀分校分子生物科学教授贾森·麦克莱伦(Jason McLellan)为COVID-19疫苗和RSV疫苗所取得的关键进展。麦克莱伦的实验室现在正与Deep Proteins小组合作,探讨AI如何加速未来针对其他病毒的疫苗设计,包括作为拉霍亚免疫学研究所领导的一项重大新多百万美元项目的一部分。

“我们通常会花很多时间手动查看结构,识别氨基酸替代,也许我们的成功率并不是特别高,比如我们必须尝试100个替代才能找到20个有效的。”麦克莱伦说,他是世界上领先的疫苗创新者之一。“我认为有了机器学习,最终成功率会更高。也许我们可以得到相同的20个替代,但只需要测试40个。”

预测稳定突变

在开发受进化启发的技术EvoRank之前,迪亚兹、克利万斯和四年级计算机科学博士生赵杰夫·欧杨(Jeffrey Ouyang Zhang)利用他们的综合专业知识开发了一个特别优雅的算法——Mutate Everything。从AlphaFold或ESM(另一种基于氨基酸序列预测蛋白质结构的AI模型)开始,Mutate Everything可以预测单点突变和高阶突变的蛋白质稳定性,旨在显著加速基于蛋白质的生物技术的研发。基于他们的框架Stability Oracle,该AI最近在《自然通讯》杂志上进行了描述,旨在识别和推荐单点突变以稳定蛋白质。

随着更多蛋白质实验数据的可用,Mutate Everything将重新训练和更新,这使得该模型在依赖生物技术的行业中(如开发救生药物)非常重要。研究团队已将该算法公开,以促进其在行业中的应用。“我们的计算工具可以告诉他们如何稳定蛋白质,这可以节省他们大量的时间和金钱。”赵杰夫·欧杨说。

然而,AI研究人员仍需应对有限的蛋白质性质实验数据,以充分训练AI模型理解蛋白质的工作原理,从而设计出不同的蛋白质。这就是为什么像Deep Proteins小组通过EvoRank从自然进化中学习的新努力可以补充基于实验数据的模型。

迪亚兹现在正致力于启动一家生物技术初创公司,专注于发明新型AI启发的蛋白质,以应对肥胖、糖尿病和癌症。“近一半的美国人患有前期糖尿病或糖尿病,大约同样多的人将在生命中的某个时刻被诊断出癌症。”迪亚兹说,“医疗保健支出目前超过了GDP增长速度,目前接近GDP的20%。如果我们继续这样下去,这些医疗保健费用将摧毁我们的国家,并给未来几代人带来巨大的财务负担。AI设计的蛋白质可以成为我们需要的超级英雄。”

六年前,当迪亚兹刚开始时,AI指导的蛋白质工程领域还处于萌芽阶段。现在,Deep Proteins团队已成为该领域中最成熟和最受尊敬的团队之一,他们在大学中的地位无人能及。他们还有一系列AI设计的蛋白质模型可以展示,这些模型越来越受到传统实验室的欢迎。“在成熟的领域中发现新事物很难。”迪亚兹说,“对于蛋白质工程的AI而言,有很多机会去做真正酷、创新的工作,并改变世界。”


(全文结束)

大健康

猜你喜欢

  • 比尔·盖茨支持纽约市机器人革命:Opentrons AI 以10,000美元起价的机器人改变科学和医学比尔·盖茨支持纽约市机器人革命:Opentrons AI 以10,000美元起价的机器人改变科学和医学
  • 非结构化数据的自然语言处理如何改善医疗保健成果非结构化数据的自然语言处理如何改善医疗保健成果
  • AI 提升罕见遗传变异影响预测AI 提升罕见遗传变异影响预测
  • Belle 和 Cloud303 借助亚马逊网络服务(AWS)推动家庭预防护理的人工智能技术发展Belle 和 Cloud303 借助亚马逊网络服务(AWS)推动家庭预防护理的人工智能技术发展
  • AI 革新罕见病药物发现AI 革新罕见病药物发现
  • 提高准确性的人工智能医疗保健工具提高准确性的人工智能医疗保健工具
  • 比尔·盖茨支持纽约市的机器人革命:Opentrons AI以10,000美元起价的机器人改变科学与医学比尔·盖茨支持纽约市的机器人革命:Opentrons AI以10,000美元起价的机器人改变科学与医学
  • 医疗人工智能市场细分及未来增长前景医疗人工智能市场细分及未来增长前景
  • Tech Mahindra 与奥克兰大学签署谅解备忘录以推动人工智能、机器学习和量子计算的创新Tech Mahindra 与奥克兰大学签署谅解备忘录以推动人工智能、机器学习和量子计算的创新
  • 人工智能能否有助于检测对黑人影响过大的疾病?人工智能能否有助于检测对黑人影响过大的疾病?
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康