科学家们在近期发表于《自然通讯》的一项研究中,分析了943名个体的甲基化组、转录组和基因组数据,以识别并描述表现出独特“开/关”开关的基因,并探索其表观遗传和遗传调控机制。
他们的分析确定了473个主要与组织特异性相关的基因,这些基因与皮肤病、代谢紊乱、免疫疾病以及癌症等疾病有关。表观遗传沉默解释了基因的普遍“开关式”行为,而组织特异性模式则由激素调控决定。
背景
“开关式”基因表达的概念最早来源于细菌研究,特别是在大肠杆菌中,乳糖的存在与否决定了某些代谢酶的生产,就像一个简单的基因开关。
随着时间推移,研究人员发现人类的基因表达远比这复杂得多,许多基因的表现更像是调光器,展现出逐渐的变化范围,而不是简单的“开”或“关”。这种复杂性受到增强子元件、表观遗传变化以及与转录因子相互作用的影响。
因此,关于人类开关式基因的研究主要集中在明确的孟德尔遗传病上,而更广泛的模式则在很大程度上未被探索。
近年来,大规模RNA测序技术的进步使得区分表现出连续(单峰)表达范围的基因和表现出双峰分布的基因成为可能,后者表明了特定组织中的真正开关式行为。
先前的研究将双峰基因表达主要与癌症联系起来,开关式的“开/关”状态与不同疾病结果相关。然而,很少有研究系统地检查开关式基因在健康和疾病状态下如何在多种组织中发挥作用。
研究内容
本研究的研究人员假设,开关式基因表达广泛存在但通常具有组织特异性,对常见疾病具有重要意义,识别这些基因可能有助于早期诊断并增进对疾病机制的理解。
他们专注于27种组织和19,121个表达水平较高的基因。表达数据经过对数转换,并通过主成分分析和广义加性模型校正技术混杂因素,同时排除手术队列样本以减少偏差。
双峰基因表达通过两轮“凹点测试”识别,采用经验再校准控制假发现率,并根据低表达水平调整效应大小阈值。
在进行共表达分析之前,对生物过程和疾病关联进行了功能富集评估。进一步的分析测试了与DNA甲基化、性别、年龄和体重指数(BMI)之间的联系,应用严格的多重检验校正。使用核密度估计离散化组织特异性表达模式,免疫组化验证了阴道组织中选定的基因表达。
关键发现
研究人员分析了27种人体组织中超过19,000个高表达基因,确定了473个表现出开关式、双峰表达的基因,即在不同个体中完全“开启”或完全“关闭”。
这些基因富含与代谢、免疫和皮肤过程以及各种癌症相关的生物通路。大多数开关式基因表现出组织特异性模式,而大约8.5%的基因在所有组织中均表现出普遍的双峰表达,主要是由于遗传因素,例如Y染色体的存在、结构变异或功能丧失突变。
一个显著的例子是常见的基因缺失,导致两个基因(USP32P2和FAM106A)普遍关闭,可能影响不孕症和2019冠状病毒病(COVID-19)的严重程度。此外,激素协调组织特异性表达,观察到明显的性别偏向:158个乳腺特异性开关基因中有157个是女性偏向的,且年龄与子宫基因切换相关(如TP53INP2下调,影响生育能力)。
激素调控和DNA甲基化
激素调控和DNA甲基化进一步帮助控制这些基因。值得注意的是,乳腺、结肠和阴道等组织中的基因表现出高度共表达,表明通过组织特异性的“主调控因子”(如雌激素)实现同步切换。
在阴道中,七个开关式基因与绝经后阴道萎缩相关,这是由于雌激素缺乏引起的。实验验证确认ALOX12为“乘客”基因(由萎缩引起),而KRT1仍可能是潜在的“驱动”基因。雌激素治疗重新激活了这七个基因中的五个,表明了潜在的治疗途径。
结论
这项研究系统地探讨了遗传和表观遗传因素如何塑造多组织中的开关式基因表达,发现了473个这样的基因。大多数表现出组织特异性模式,受激素和DNA甲基化调控;一小部分由于遗传变异而具有普遍的开关式特征。
关键见解将这些基因与激素紊乱、感染和癌症联系起来。两项研究重点浮现:利用长读长测序技术揭示隐藏的结构变异(如GPX1P1未解决的案例),并将开关式状态整合到基因-环境研究中(如GSTM1缺失+母亲吸烟→哮喘风险)。
研究的主要优势在于结合了近一千名个体的基因组、转录组和甲基化组的多层次分析。然而,一个局限性在于RNA水平的双峰性可能不会直接转化为蛋白质水平的影响,因为调控机制缓冲了蛋白质表达。
该研究强调了驱动基因的实验验证和多样化队列研究。总体而言,这项工作推进了对基因调控的理解,并提出了通过个性化方法预测和管理疾病风险的新途径。
(全文结束)

