因美纳已推出其称之为迄今为止组装的最大规模的全基因组遗传扰动数据集,该资源旨在加速整个制药行业基于人工智能的药物发现。新的十亿细胞图谱代表了该公司计划在未来三年内完成的五亿细胞图谱的第一部分。因美纳表示,该项目最终将形成迄今为止生成的最全面的人类疾病生物学地图。
该图谱正在与阿斯利康、默克和礼来合作构建,这三家公司作为创始参与者参与其中。这些公司共同生成了一套精选的细胞系,用于验证药物靶点、训练大规模AI模型,并研究历史上难以研究的生物学机制。
因美纳首席执行官雅各布·赛恩斯博士表示,该计划的规模旨在重塑AI在早期发现中的应用方式。“我们认为细胞图谱是一个关键发展,将使我们能够显著扩展AI在药物发现中的应用,”他说。“我们正在构建一个无与伦比的资源,用于训练下一代AI模型,以支持精准医疗和药物靶点识别。”
制药合作伙伴如何计划使用图谱
默克计划利用该数据集支持其在整个药物发现管道和AI/ML模型中的精准医疗方法。该公司预计该图谱将帮助训练其专有的基础模型,并支持开发虚拟细胞模型,以改善疾病适应症预测。“通过利用先进的基因组患者数据集,默克科学家正在构建和利用基于真实生物变异(而不仅仅是文献文本)的AI模型,”默克数据、AI与基因组科学副总裁兼负责人伊亚·哈利勒博士说。“通过与因美纳的紧密合作,我们正在建立一座从基因组洞察到治疗影响的可扩展桥梁。”
阿斯利康将该图谱视为连接遗传信号与可操作生物学的工具。“将遗传信息转化为对疾病机制的清晰理解——并最终转化为药物——仍然是研发中的核心挑战,”该公司基因组研究中心副总裁斯拉维·佩特罗夫斯基博士说。“通过展示特定遗传扰动在人类细胞内的作用方式,我们可以帮助将遗传信号转化为可直接研究的机制生物学。”
礼来强调了规模对下一代AI模型的重要性。“下一代AI驱动的药物发现将依赖于前所未有的生物数据规模,”礼来心脑代谢研究集团副总裁露丝·希梅诺博士说。“涵盖多种细胞类型的综合数据集提供了生成人类疾病有意义洞察所需的关键基础。”
十亿细胞图谱内部详情
该图谱捕捉了十亿个单个细胞对基于CRISPR的扰动的反应,覆盖200多种与疾病相关的细胞系,涉及免疫、肿瘤、心脑代谢、神经和罕见遗传疾病。通过在这些多样化的细胞类型中系统地开启或关闭基因,研究人员可以在单细胞分辨率下观察功能后果——这些数据可用于表征作用机制、识别新的适应症并验证遗传支持的靶点。
该项目是因美纳新成立的BioInsight业务部门的首个主要数据产品。该公司正在使用其Single Cell 3’ RNA prep平台,每次实验捕获数百万个细胞,并预计在第一年内生成约20拍字节的转录组数据。这些数据通过DRAGEN管道处理,并托管在因美纳的Connected Analytics云平台上进行大规模分析。
因美纳表示,十亿细胞图谱是与合作伙伴共同构建多亿细胞数据集的更广泛努力的基础,最终将贡献于去年宣布的五亿细胞资源。
【全文结束】

