图注:BoltzGen发布后仅数日,10月30日便有超过300人参加其研讨会。图片来源:Ethan Wu, Will Stokes
10月30日(周四),来自学术界和工业界的300多人涌入礼堂,参加由健康机器学习阿卜杜勒·拉蒂夫·贾米尔诊所(MIT贾米尔诊所)主办的BoltzGen研讨会。本次活动的主角是麻省理工学院(MIT)博士生、BoltzGen第一作者汉内斯·施塔克(Hannes Stärk),他仅在几天前刚刚宣布了BoltzGen。
BoltzGen基于Boltz-2开发,后者是一款开源生物分子结构预测模型,能够预测蛋白质结合亲和力,曾在今夏引起轰动。BoltzGen是同类模型中首个更进一步生成新型蛋白质结合剂的模型,这些结合剂可直接进入药物发现流程。相关研究成果已发布在预印本服务器bioRxiv上。
关键创新与模型能力
三大关键创新使这一成果成为可能:首先,BoltzGen能够执行多种任务,在保持最先进性能的同时统一蛋白质设计与结构预测。其次,BoltzGen内置的约束条件是根据湿实验室合作者的反馈设计的,以确保模型创造的功能性蛋白质不会违背物理或化学定律。最后,严格的评估流程在"难以成药"的疾病靶点上测试模型,突破了BoltzGen结合剂生成能力的极限。
目前行业或学术界使用的大多数模型只能进行结构预测或蛋白质设计。此外,它们仅限于生成能成功与简单"靶点"结合的特定类型蛋白质。就像学生回答看起来像家庭作业的考题一样,只要训练数据在结合剂设计过程中与靶点相似,这些模型通常就能奏效。但现有方法几乎总是在已有结合剂结构的靶点上进行评估,而在更具挑战性的靶点上使用时,性能往往会下降。
施塔克指出:"已有模型试图解决结合剂设计问题,但问题在于这些模型是模态特定的。"
"通用模型不仅意味着我们可以处理更多任务。此外,我们还能获得针对单个任务的更好模型,因为模拟物理学是通过示例学习的,而更通用的训练方案能提供更多包含可泛化物理模式的示例。"
验证、行业影响与未来展望
BoltzGen研究人员特意在26个靶点上测试了BoltzGen,范围从具有治疗相关性的案例到与训练数据明显不同的靶点。这一全面的验证过程在学术界和工业界的八个湿实验室中进行,展示了该模型的广度和突破性药物开发潜力。
在湿实验室环境中测试BoltzGen的行业合作伙伴之一Parabilis Medicines赞赏了BoltzGen的潜力:"我们认为,将BoltzGen纳入我们现有的Helicon肽计算平台能力,有望加速我们开发针对重大人类疾病的变革性药物的进程。"
虽然Boltz-1、Boltz-2以及现在的BoltzGen(10月22日在第7届分子机器学习会议上预览)的开源发布为药物开发带来了新的机遇和透明度,但这也表明生物技术和制药行业可能需要重新评估其产品。在社交媒体平台X上热议BoltzGen之际,LabGenius的首席机器学习科学家贾斯汀·格雷斯(Justin Grace)提出了一个问题。
他在一篇帖子中写道:"聊天AI系统的私有到开源性能滞后时间为七个月且正在缩短。在蛋白质领域,这一时间似乎更短。当我们只需等待几个月就能获得免费版本时,提供'结合剂即服务'的公司如何能够收回投资?"
对于学术界人士而言,BoltzGen代表着科学可能性的扩展和加速。"我的学生经常问我一个问题:'AI能在治疗领域带来哪些改变?'"贾米尔诊所AI教师负责人、计算机科学与人工智能实验室(CSAIL)附属机构的MIT教授、资深合著者雷吉娜·巴齐莱(Regina Barzilay)表示。
她补充道:"除非我们确定难以成药的靶点并提出解决方案,否则我们不会改变游戏规则。这里的重点是未解决的问题,这使得汉内斯的工作与其他领域的工作有所区别。"
资深合著者、贾米尔诊所和CSAIL附属机构的电气工程与计算机科学托马斯·西贝尔教授汤米·亚阿科拉(Tommi Jaakkola)指出,"像BoltzGen这样完全开源发布的模型,能够促进更广泛的社区努力,加速药物设计能力。"
展望未来,施塔克相信生物分子设计的未来将被AI模型彻底改变。他表示:"我想构建帮助我们操控生物学以解决疾病,或执行我们甚至尚未想象到的分子机器任务的工具。"
"我想提供这些工具,使生物学家能够想象他们以前从未想过的事物。"
【全文结束】

