研究人员开发出可映射人类细胞中基因协同工作方式的AI模型 - AI与医疗健康

研究人员开发出可映射人类细胞中基因协同工作方式的AI模型Researchers develop AI model that maps how genes work together in human cells

环球医讯 / AI与医疗健康来源：phys.org美国 - 英语2026-05-22 23:18:38 - 阅读时长4分钟 - 1632字

西奈山伊坎医学院的科学家们成功开发出一种新型基因集基础模型(GSFM)，该AI模型能够学习并映射人类细胞中基因在不同生物情境下如何协同工作的复杂模式，为理解基因功能组织提供了全新方法，有望显著改善疾病诊断、生物标志物识别和药物研发效率，该模型通过分析数百万个基因集进行训练，展示了在实验确认前预测基因-基因和基因-功能关系的能力，代表了人工智能在生物医学领域的重大突破，将为精准医疗和个性化治疗的发展提供强大支持，并可能彻底改变科学家研究和理解人类生物学的方式。

西奈山伊坎医学院的科学家们创建了一种新的人工智能(AI)模型，该模型有助于揭示基因如何在人类细胞内部协同工作，为理解生物学和疾病提供了强有力的全新方法。

发表在《Patterns》期刊上的这项研究介绍了一种基因集基础模型(GSFM)，该模型旨在学习基因在数千种生物情境中如何分组和发挥作用的模式。论文题为"GSFM：在大规模多样化基因集集合上预训练的基因集基础模型"。

这项工作从大型语言模型(LLMs)如ChatGPT的进展中获得灵感，这些模型学习词语如何根据上下文获得意义。类似地，GSFM学习基因如何根据不同细胞"上下文"表现出不同行为。

"基因很少单独行动。相反，它们参与多个生物过程，根据在细胞中活跃的位置和时间形成不同的分子组合。单个基因在不同环境中可以扮演不同角色，就像一个词语在不同句子中可以有不同含义一样，"西奈山伊坎医学院(Icahn School of Medicine at Mount Sinai)药理科学教授、西奈山生物信息学中心(Mount Sinai Center for Bioinformatics)主任、资深通讯作者Avi Ma'ayan博士说道。

"正如现代语言模型从上下文中学习词语的含义，我们询问AI是否能以同样方式学习基因的'含义'。我们的GSFM正是为此而设计的。"

该模型为理解人类细胞内基因及其产物的结构和功能组织提供了新方法。这种改进的理解最终可能支持开发更好的诊断方法、生物标志物和疗法。

研究者表示，通过在多种生物情境中映射基因之间的相互关系，GSFM创建了一个参考框架，可以帮助科学家更有效地解释复杂的多组学数据集。

"细胞内基因的组织仍然是生物学中主要的未解之谜之一。GSFM通过从已发表研究和基因表达数据集衍生的数百万基因组合中学习来解决这一问题，"Ma'ayan博士说道。

该模型可以：