陈·扎克伯格倡议组织(Chan Zuckerberg Initiative, CZI)报告了其最新的人工智能模型,该模型旨在通过聚焦控制细胞行为的关键网络,帮助研究人员更好地理解细胞行为,从而使复杂的生物学问题(如癌症)更容易解决。
该模型名为GREmLN(Gene Regulatory Embedding-based Large Neural model,基于基因调控嵌入的大型神经模型),是CZI“重大挑战”项目的一项里程碑,该项目旨在构建一系列人工智能生物模型,以预测和理解细胞在各个层面的工作原理——从分子到整个生物系统——并帮助科学家治疗、预防和管理所有疾病。
详细信息发表在预印本服务器bioRxiv上。
GREmLN的设计目的是帮助研究人员识别细胞基因如何协同工作——以及哪些因素可能导致其异常运作,从而引发癌症或神经退行性疾病等疾病。
“GREmLN是一种理解细胞如何做决策的全新方法,更重要的是,它揭示了这些决策在诸如癌症等疾病中如何出错,”陈·扎克伯格纽约生物中心(Chan Zuckerberg Biohub New York)主席兼哥伦比亚大学瓦格洛斯医学院(Columbia University Vagelos College of Physicians and Surgeons)化学与系统生物学教授Andrea Califano表示。
“我们的模型提供了一种以生物学为基础的方法,利用人工智能获得对健康和疾病的全新见解。这个模型不是试图重塑生物学以适应人工智能,而是重塑人工智能以适应生物学。”
与大多数人工智能模型不同,GREmLN聚焦于定义基因如何相互作用和影响的“分子逻辑”,类似于细胞内部的对话。它将为科学家提供一种方法,追踪可精准识别疾病最早迹象和潜在新治疗靶点的关键变化。
GREmLN是在来自Chan Zuckerberg CellxGene的超过1100万个数据点上训练而成的。CellxGene是一个每周被数千名科学家使用的工具,旨在通过探索和比较来自大脑、肺、肾和血液等组织的单个细胞数据,帮助加快发现进程。
很快,该模型将被扩展,以帮助解决关键的生物学和医学问题,使研究人员能够在细胞变为癌细胞或神经元开始积累损伤之前,就检测到这些变化——在这些变化变得不可逆之前。
“理解细胞行为意味着理解每个细胞内部发生的对话网络,”CZI人工智能高级总监Theofanis Karaletsos表示。
“GREmLN以前所未有的方式捕捉了这种复杂性。这是迈向构建帮助我们模拟和预测细胞行为系统的一步。”
未来,GREmLN可以推动广泛的研究应用,从阻止癌细胞逃避治疗的能力,到防止炎症对脑细胞造成不可逆损害。
它还可以帮助研究人员预测细胞对新药的反应,并最终大幅提高这些药物在临床试验中的成功率。最终,GREmLN是新一代人工智能工具的一部分,旨在帮助科学家理解生命本身的复杂逻辑。
GREmLN加入了CZI及其Biohubs构建的一系列生物模型,包括最近发布的TranscriptFormer,这是第一个大规模整合不同物种数据集的生成式人工智能模型,旨在帮助研究人员探索细胞如何运作。这两种模型在生物医学研究、疾病诊断和治疗开发方面都有广泛的应用。
这些模型是该组织“虚拟细胞平台”(virtual cell platform)的一部分,该平台对全球科学界开放且可访问。研究人员可以在该平台上访问GREmLN,包括一个快速入门教程;以及GitHub上的代码库。
更多信息:Mingxuan Zhang等,GREmLN: A Cellular Regulatory Network-Aware Transcriptomics Foundation Model,bioRxiv(2025)。DOI: 10.1101/2025.07.03.663009
期刊信息:bioRxiv
提供者:Chan Zuckerberg Initiative
【全文结束】

