破解复杂疾病基因网络
美国西北大学生物物理学家开发出新型计算工具,可识别糖尿病、癌症和哮喘等复杂疾病的基因组合机制。这类疾病不同于单基因遗传病,其发病受多个基因协同作用影响。研究团队利用生成式人工智能模型,将有限的基因表达数据进行增强,成功解析引发复杂性状的基因活动模式,这项突破可能带来针对多基因分子靶点的新疗法。
这项名为"复杂性状因果基因组生成式预测"的研究成果发表于《美国国家科学院院刊》。资深作者Adilson Motter教授指出:"多数疾病由基因组合而非单一基因决定。就像飞机失事需要多个系统故障共同作用,不同基因组合可能导致相似疾病表型。我们的模型能简化这种复杂性,识别关键基因及其集体影响。"
Motter教授是西北大学物理与天文学系主任,其团队包括博士后研究员Benjamin Kuznets-Speck、研究生Buduka Ogonor和研究助理Thomas Wytock。他们开发的TWAVE(全转录组条件变分自编码器)模型,结合机器学习与优化算法,从有限的人类基因表达数据中识别模式,通过模拟健康与疾病状态,将基因表达变化与表型变化进行匹配。
突破传统研究局限
现有全基因组关联研究(GWAS)主要寻找与特定性状相关的单个基因,但缺乏检测基因组合效应的统计能力。Motter教授指出:"人类基因组计划显示,我们的基因数量仅是细菌的6倍,这种复杂性必须源于多基因相互作用。"
研究团队聚焦基因表达而非基因序列本身,这带来双重优势:既规避患者隐私问题(基因组数据具有高度个体特异性),又能间接反映环境因素对基因表达的调控作用。Wytock强调:"环境因素不会改变DNA序列,但会显著影响基因表达水平,这种动态特性使我们的模型更具现实应用价值。"
个性化治疗新路径
测试显示,TWAVE成功识别出传统方法遗漏的致病基因,并首次证实:同种复杂疾病在不同患者体内可能由不同基因组合作用引发。Motter教授解释:"两个患者可能呈现相似症状,但由于遗传背景、环境暴露和生活方式差异,实际涉及的基因组合可能完全不同。这种发现将彻底改变治疗策略。"
该技术已应用于多种复杂疾病的病因解析:
- 糖尿病:识别出影响胰岛素代谢的基因网络
- 肿瘤:发现调控细胞增殖的关键基因组合
- 呼吸系统疾病:解析气道炎症相关基因协同作用
研究团队正在优化模型预测精度,未来将结合单细胞测序技术,为每位患者定制"基因组-环境"相互作用图谱,推动精准医疗发展。这项突破不仅在医学领域具有革命性意义,也为合成生物学、作物遗传改良等跨学科研究提供全新工具。
【全文结束】

