伦敦
星期六,2025年7月19日,印度标准时间18:00
总部位于旧金山和伦敦的Prima Mente公司宣布推出Pleiades模型家族。这是一家致力于为分子生物学和神经退行性疾病研究构建原生人工智能基础设施的全球性企业。Pleiades是一系列大规模基础模型,旨在理解人类疾病的表观基因组和分子图景。
Pleiades代表了生成式Transformer模型(参数规模分别为9000万、6亿和70亿),其训练数据包含1.9万亿个token,分辨率达到单核苷酸级别。这项工作在最新发布的预印本中介绍,合作作者来自牛津大学、耶路撒冷希伯来大学和哥德堡大学。
Pleiades基于人类细胞类型甲基化图谱以及循环游离DNA(cfDNA)进行训练,标志着阿尔茨海默病研究和转化医学的新时代——它能够以前所未有的分辨率在多种细胞亚型中从血液中检测疾病相关信号,识别用于实验设计的分子特征,并揭示早期干预的潜在靶点。
Prima Mente首席执行官Ravi Solanki表示:“我们认为表观遗传学和cfDNA为我们理解大脑提供了一个强大但尚未被充分利用的切入点。它们让我们能够以非侵入性的方式观察细胞活动和功能障碍——特别是在神经退行性疾病中,其分辨率在过去几年中是难以想象的。通过Pleiades,我们正在构建AI基础设施,将这些信号转化为有意义的发现、诊断,最终实现干预。”
与传统模型不同,Pleiades采用大规模基于Transformer的架构,直接从原始测序数据中学习。它可以预测cfDNA片段的细胞来源,揭示组织和疾病特异性的甲基化模式,并生成合成的cfDNA以支持计算机模拟实验。关键的是,研究团队证明模型性能随着数据和计算资源的增加而可靠提升,将大型语言模型和视觉模型中观察到的AI扩展定律扩展到生物学领域,为未来的多组学建模奠定了基础。
该模型迄今已被应用于多种生物学任务,包括组织分类、疾病检测和片段重建,使其能够在不同组织和疾病之间进行泛化学习,同时获取共享的分子功能表示。在早期的阿尔茨海默病研究中,Pleiades已展现出识别神经元、小胶质细胞和T细胞来源的cfDNA信号的能力,这些信号可以在临床症状出现之前就预示神经退行性病变。
哥德堡大学神经退行性疾病研究专家Henrik Zetterberg教授表示:“Pleiades代表了我们使用血液生物标志物研究阿尔茨海默病的重要进步。在如此精细的水平上理解细胞类型来源和调控紊乱,可能实现更早、更准确的诊断,并揭示新的生物学干预途径。我非常高兴看到这一方法与基于蛋白质的生物标志物相结合的表现——未来还有大量令人兴奋的研究可以展开,而这项技术确实为个性化医学方法打开了大门,使我们能够识别具有不同疾病驱动因素的神经退行性疾病亚型。”
Prima Mente与NVIDIA合作,利用DGX基础设施进行训练扩展,确保高性能计算资源可用于解码复杂疾病的生物学机制。此外,为了训练和测试Pleiades,Prima Mente还与Nebius、Siam AI和Eternis Labs合作,建立分布式计算基础设施。未来团队将继续在数据收集和后续训练项目上展开合作。
Pleiades的发布标志着Prima Mente公司进入了一个强劲的发展阶段。除了模型发布外,该公司还建立了湿实验室,用于高通量多组学数据生成,并开始在调控、转录组和蛋白质组层面建模疾病进展。公司将于下月启动一项涉及1000名患者的阿尔茨海默病研究,并正在积极与人工智能、学术界和生命科学领域建立合作伙伴关系,以将这些模型转化为发现、诊断和干预的实用工具。
【全文结束】

