在一项重大发展中,麻省理工学院(MIT)Jameel健康机器学习诊所的科学家们推出了Boltz-1,这是一款开源AI模型,有望革新生物医学研究和药物开发。该模型以物理学家路德维希·玻尔兹曼(Ludwig Boltzmann)命名,他的统计力学奠定了理解分子系统的基础,旨在使最先进的生物分子建模更加普及。
Boltz-1是第一个完全商业可访问的开源AI模型,其性能可与DeepMind最新的生成式AI模型AlphaFold3相媲美。AlphaFold3以其在预测蛋白质和其他生物分子的三维结构方面的开创性准确性而闻名。由MIT研究生杰里米·沃尔伦德(Jeremy Wohlwend)和加布里埃尔·科尔索(Gabriele Corso)、研究助理萨罗·帕萨罗(Saro Passaro)以及教授雷吉娜·巴尔齐莱(Regina Barzilay)和托米·贾科拉(Tommi Jaakkola)共同开发的新开源AI模型,代表着在民主化生物分子研究方面迈出的关键一步,使全球研究人员和组织能够在不受专有权限制的情况下进行创新。
他们的研究成果发表在题为《民主化生物分子相互作用建模》的论文中。
蛋白质结构预测的重要性
蛋白质是生命的基本组成部分,几乎参与所有生物过程。它们的功能与其三维结构密切相关,这些结构由长链氨基酸折叠而成。准确预测这些结构对于设计新药、理解疾病以及设计具有特定功能的蛋白质至关重要。历史上,这一任务由于折叠过程的复杂性而充满挑战。
像AlphaFold2这样的AI模型的出现标志着一个转折点,为研究人员提供了以前所未有的精度预测蛋白质结构的工具。这项创新使德米斯·哈萨比斯(Demis Hassabis)和约翰·乔普(John Jumper)获得了2024年的诺贝尔化学奖。然而,AlphaFold3缺乏完全的开源访问权限,造成了一个真空地带,而Boltz-1旨在填补这一空白。
Boltz-1在AlphaFold3的基础上进行了改进,引入了扩散模型等生成式AI技术来解决蛋白质折叠预测中的不确定性。MIT团队引入了新的算法以提高准确性和效率,结果是开发出了一个能与AlphaFold3相媲美的模型。重要的是,Boltz-1的开源性质使其与众不同,提供了一个透明的训练和微调管道,使全球研究人员能够贡献并受益于其能力。
开发Boltz-1并非易事。在四个月内,研究人员解决了蛋白质数据库(PDB)中的模糊性和异质性问题,这个数据库积累了70年的生物分子结构数据。“没有捷径可走,”沃尔伦德承认,“我们度过了许多个不眠之夜,与数据搏斗。”
对药物开发的影响
Boltz-1的发布在科学界引发了广泛的热情。通过降低进入先进工具的门槛,它使来自不同领域的研究人员能够加速结构生物学的发现。例如,Parabilis Medicines的首席执行官马泰·马门(Mathai Mammen)称赞Boltz-1是一个“突破”模型,将使结构生物学工具的访问更加民主化,促进医学上的变革性进展。
MIT生物学教授乔纳森·韦斯曼(Jonathan Weissman)也表达了类似的观点,预测Boltz-1的可访问性将带来一波由其驱动的发现。“我们将看到大量创造性的新应用,”他说,强调该模型在分子科学领域的创新潜力。
Boltz-1的核心理念是邀请全球合作。其GitHub存储库和专用Slack频道鼓励研究人员进行实验、分享发现并提出改进建议。这种协作框架与更广泛的开放科学愿景一致,确保Boltz-1随着来自多样化科学社区的贡献不断发展。
“我们认为还有许多年的工作可以改进这些模型,”沃尔伦德指出,“我们非常渴望与其他研究人员合作,看看社区会用这个工具做些什么。”
未来的无限可能性
Boltz-1的影响远不止于蛋白质结构预测。通过提供一个可访问且强大的平台,该模型为合成生物学、个性化医学和生物制造的进步奠定了基础。研究人员可以利用Boltz-1设计具有特定功能的新型蛋白质,为治疗、诊断和可持续生物工程开辟道路。
Boltz-1标志着利用AI加速生物医学研究的新时代。其开源理念使全球研究人员能够应对科学和医学中的紧迫挑战。随着其不断进化,Boltz-1将继续推动跨学科创新,使我们更接近一个工具可及性改变生活、重新定义可能性的未来。
(全文结束)

