AI模型提升药物研发组合实力AI Models Enhance the Drug Discovery Portfolio

环球医讯 / 创新药物来源:www.genengnews.com美国 - 英语2025-11-02 01:17:37 - 阅读时长7分钟 - 3371字
本文深入剖析人工智能模型如何革新药物发现领域,重点阐述桑德博克斯AQ的大型定量模型突破文本数据局限、麻省理工学院与Recursion公司合作的Boltz-2系统实现千倍速结合亲和力预测、Leash生物科技通过高质量数据集构建高效预测模型,以及瑞特罗生物科技运用GPT-4微型版优化细胞重编程技术等前沿进展,揭示AI通过精准模拟蛋白质相互作用、加速小分子筛选及设计新型治疗性蛋白等方式显著缩短研发周期并降低成本,为癌症、衰老相关疾病及免疫系统疾病治疗带来突破性希望,标志着药物研发正式迈入智能化新纪元。
AI药物研发小分子结合技术蛋白质设计细胞重编程癌症免疫系统疾病衰老研究结合亲和力预测优质数据简约模型架构
AI模型提升药物研发组合实力

麻省理工学院科学家正在使用微流控技术精确研究单个细胞。该公司致力于开发逆转年龄相关功能障碍的疗法。

在与《GEN》的访谈中,桑德博克斯AQ(SandboxAQ)产品与AI模拟及平台部门主管阿尔曼·扎里巴菲安博士表示:“药物发现领域尚未迎来‘ChatGPT时刻’。我们不能仅依赖基于文本数据训练的机器学习模型来解决世界最棘手的问题,癌症的治愈方案不会写在维基百科上。”

桑德博克斯AQ是跨国科技巨头Alphabet分拆的企业,旨在推进大型定量模型(LQMs)的社会应用,包括药物发现。与基于文本数据训练的大型语言模型(LLMs)不同,LQMs立足于物理学原理以模拟现实系统。2024年,谷歌DeepMind的AlphaFold3和诺贝尔奖得主大卫·贝克博士实验室开发的RoseTTAFold All-Atom的发表,标志着技术转折点——蛋白质结构预测能力从肽链扩展至小分子、核酸、金属离子等相互作用领域。

这些结构共折叠模型能预测“结合构象”(即配体如何与靶蛋白结合),但尚未实现结合亲和力(相互作用强度)的预测。若能精准预测结合亲和力,将为资源密集型实验筛选提供强大替代方案,大幅缩短研发周期并降低成本。

小分子结合技术突破

2024年6月,麻省理工学院研究人员与盐湖城AI药物发现公司Recursion(2024年与Exscientia合并)宣布开源Boltz-2系统。该系统以全新速度和精度实现结合亲和力预测,推动AI小分子药物发现技术在商业领域的普及。

在2024年12月举行的第16届蛋白质结构预测关键评估(CASP16)竞赛中,Boltz-2成为结构生物学领域最先进模型的基准测试冠军。其计算速度达每秒20次结合亲和力预测,比当前基于物理计算的标准方法——自由能微扰(FEP)模拟快1000倍。该模型采用高度宽松的MIT许可协议,允许商业药企内部使用并整合自有专有数据。

扎里巴菲安强调,蛋白质-配体结构复合物与药代动力学(身体对药物的影响)及药效动力学(药物对身体的影响)数据的缺失,仍是AI药物发现的主要瓶颈。解决该问题的一种方案是利用计算预测结构生成合成训练数据。

Boltz-2发布数周后,桑德博克斯AQ联合英伟达推出结构增强型IC50数据库(SAIR)。该开源库利用Boltz系列模型生成计算折叠的蛋白质-配体结构,并关联实验测得的药物亲和力数值。SAIR包含来自ChEMBL和BindingDB实验数据库的100多万个独特蛋白质-配体对,总计520万个3D结构,经Boltz-1x计算折叠(Boltz-1x是生物分子复合预测模型Boltz-1的增强版,可优化结构以符合物理规律并防止内部几何畸变)。据SAIR技术报告,97%的Boltz-1x折叠结构通过了计算工具PoseBusters的生物物理合理性检验。

尽管Boltz-2训练集包含ChEMBL和BindingDB数据(并涵盖SAIR所有复合物),其他研究团队已报告将SAIR应用于AI药物发现。扎里巴菲安透露,锝泰克生物科技(Technetium Therapeutics)正利用SAIR构建代理式AI模型,专注于癌症和免疫系统疾病的候选药物筛选;德克萨斯农工大学研究人员则生成基础模型,为治疗应用设计靶蛋白口袋内的新型配体。

莱什生物科技(Leash Bio)首席执行官伊恩·奎格利博士在《GEN》访谈中指出:“若需对结合后的小分子进行修饰,理解结合构象至关重要,但早期药物发现核心问题仍是‘分子能否结合’。预测结合亲和力的能力非常重要,我们感谢学界日益重视该方向。”

优质数据与简约架构

总部位于盐湖城的初创企业莱什生物科技致力于填补小分子药物发现的数据缺口。奎格利表示,生命科学数据集常存在批次效应和技术噪声,导致模型难以做出精准生物学预测。

“有个著名数据集收集了马术商业摄影师的马匹照片,所有图片角落都带有摄影公司水印,”奎格利解释道,“结果发现,只要在任意照片添加该水印,训练于此数据的AI模型就会判定为马匹。生命科学领域同样存在‘数据水印’问题。”

奎格利认为,生成筛选数百万小分子对数百种蛋白质靶点的高质量大规模数据集,即使采用简约模型架构也能实现强大预测性能。

2024年7月,莱什宣布推出Hermes系统——该小分子-蛋白质结合预测模型完全基于公司自研平台生成的内部数据训练。Hermes非结构模型,仅根据氨基酸序列和小分子简化分子线性输入系统(SMILES)表征预测结合可能性。莱什宣称,该模型的简约性带来速度优势,在基准测试中比Boltz-2快200-500倍且预测性能更优。仅两个月后,莱什又推出Artemis工具,利用Hermes探索靶标化学空间。

从头设计蛋白质

尽管小分子药物仍是行业主流,众多专家正着眼于蛋白质复杂性以解决治疗难题。

潜隐实验室(Latent Labs)首席执行官西蒙·科尔博士曾任谷歌DeepMind研究员,全程参与2024年诺贝尔化学奖得主算法AlphaFold2的开发。他创立潜隐实验室旨在构建生物学前沿模型,首先实现蛋白质从头设计。

潜隐实验室研究人员开发生成式AI模型设计新抗体、优化现有酶并推进基因工程。2024年7月,该公司发布首款前沿模型Latent-X,用于从头蛋白质设计。湿实验室实验中,Latent-X仅需测试每个靶标30-100个候选物即可达到皮摩尔级强结合亲和力,相较传统药物研发流程(需筛选数百万随机分子且命中率低于1%)实现重大突破。

Latent-X的设计聚焦治疗相关的微型结合体和大环化合物。头对头实验比较显示,其结合亲和力与当前最先进的蛋白质设计模型RFdiffusion和AlphaProteo相当。

科尔强调,该模型在全原子层面联合建模序列与结构的架构使Latent-X独具特色。

“我们发布的视频展示了模型如何形成特定氢键和芳香环π堆积。端到端直接生成生物化学特性使我们能从源头设计更优分子,”科尔在《GEN》访谈中表示。

Latent-X提供网页用户界面,无需计算背景的研究人员亦可使用。科尔指出,潜隐实验室的核心理念是为制药公司和学术团队提供指导,明确其蛋白质设计工作流所需的硬件与模型配置。

“在此领域无需专业知识和AI基础设施即可使用技术,才是真正的技术普及化,”科尔强调。

细胞重编程革命

从设计自然界不存在的蛋白质到延长健康寿命,瑞特罗生物科技(Retro Biosciences)正应用AI模型推进衰老研究的细胞重编程。该公司业务横跨细胞疗法到小分子等不同治疗模式。

“我们视自身为投资组合,针对该使命采取多路径并行策略,”瑞特罗首席执行官乔·贝茨-拉克鲁瓦博士向《GEN》表示,“不同模式各有优劣且高度互补,使瑞特罗作为单一公司具备强大韧性。”

2024年8月,瑞特罗与OpenAI合作宣布:利用GPT-4b micro(专为蛋白质工程优化的GPT-4o微型版),设计出改进型山中因子(Yamanaka factors)变体。山中因子是由四种特定转录因子(Oct4、Sox2、Klf4和c-Myc)组成的集合,可将成体体细胞重编程为诱导多能干细胞(iPSCs)。

“蛋白质序列与结构模型从原始数据学习规律,但无法基于文献已知知识进行提示。在重编程领域,约20年的文献积累无需从头学习,”瑞特罗应用AI部门主管里科·梅因尔在《GEN》访谈中指出。

经GPT-4b micro重新设计的蛋白质在体外实验中,干细胞重编程标记物表达量比野生型对照组高出50多倍,并展现出增强的DNA损伤修复能力,表明其再生潜力显著提升。

瑞特罗科学家使用液体处理机器人开发自动化协议以加速实验室流程。自动化筛选助力公司识别靶向衰老机制的细胞干预方案。该模型将蛋白质信息以文本描述形式整合,包括共进化同源序列和蛋白质相互作用网络,使GPT-4b micro能生成具有特定设计属性的新序列。由于大部分数据无需结构信息,该模型既适用于结构化蛋白质,也适用于具有内在无序区域的蛋白质(包括依赖与多样结合伙伴瞬时相互作用的山中因子)。

从预测小分子结合亲和力到细胞重编程,大规模生物数据结合新型模型架构持续推动AI革命。计算能力的提升能否全面提升治疗潜力,时间将给出答案。

【全文结束】

大健康

猜你喜欢

  • 泛素-蛋白酶体系统导致造血干细胞失去极性并衰老泛素-蛋白酶体系统导致造血干细胞失去极性并衰老
  • 新型AI工具可评估1000多种疾病的发病风险新型AI工具可评估1000多种疾病的发病风险
  • 论干细胞的永生性论干细胞的永生性
  • 新AI工具可一次性评估1000多种疾病风险新AI工具可一次性评估1000多种疾病风险
  • 2025年AI在药物发现领域的现状2025年AI在药物发现领域的现状
  • AI解锁RNA在痴呆症和新兴病毒威胁中的作用AI解锁RNA在痴呆症和新兴病毒威胁中的作用
  • 堪萨斯城研究人员新发现免疫系统与衰老及慢性疾病关联堪萨斯城研究人员新发现免疫系统与衰老及慢性疾病关联
  • 胰腺癌发生前细胞中发现类似痴呆症的蛋白质团块胰腺癌发生前细胞中发现类似痴呆症的蛋白质团块
  • 单一药物首次证实"近乎通用"药物分子伴侣对罕见病的疗效单一药物首次证实"近乎通用"药物分子伴侣对罕见病的疗效
  • 首次发现“近乎通用”的药物分子伴侣用于罕见病治疗首次发现“近乎通用”的药物分子伴侣用于罕见病治疗
  • 研究员开发AI驱动药物发现工具获帝国AI支持研究员开发AI驱动药物发现工具获帝国AI支持
  • AI有望在10年内"消除所有主要疾病",助力早期诊断AI有望在10年内"消除所有主要疾病",助力早期诊断
  • 单一药物或可稳定人类GPCR几乎所有突变版本单一药物或可稳定人类GPCR几乎所有突变版本
  • 研究者AI赋能药物发现工具获帝国AI支持研究者AI赋能药物发现工具获帝国AI支持
  • 新型AI工具可预测患者千余种疾病风险新型AI工具可预测患者千余种疾病风险
  • 新型AI工具"可一次性评估1000多种疾病的患病风险"新型AI工具"可一次性评估1000多种疾病的患病风险"
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康