自人类基因组计划20多年前完成以来,我们对人类基因组的理解已经取得了长足的进步。当时,科学家们认为他们已经绘制出了所有编码蛋白质的基因。然而,一项新的研究揭示,我们可能遗漏了大量的隐藏基因。这些所谓的“暗基因”可能有助于解释几十年来一直困扰科学家的癌症和免疫反应等过程。
这些基因为何如此难以捉摸?它们位于DNA的一段区域,曾被认为是“垃圾”——这部分基因组被认为没有用途,因为它们似乎不编码蛋白质。然而,随着研究人员深入研究,他们发现这些区域并非毫无用处。相反,它们包含生产微蛋白的指令——微蛋白是由少量氨基酸组成的微型蛋白质。
在一项全球性的努力中,尚未经过同行评审的研究成果发表在预印本期刊《bioRxiv》上,科学家们分析了近10万个实验的数据,寻找这些微蛋白的证据。他们使用了尖端技术,如质谱分析,该技术将蛋白质分解成更小的部分以研究其结构,以及免疫肽组学,该技术专注于免疫系统检测到的蛋白质片段。
结果表明,在7,264个先前被忽视的DNA序列中,至少有四分之一惊人地产生了蛋白质,这为我们对基因组的理解增添了超过3,000个新基因。这可能只是冰山一角——研究人员认为还有数万个等待发现。
为什么这些基因长期以来一直未被发现?
这归结于科学家们传统上寻找基因的方式。编码蛋白质的基因通常以特定的DNA序列开始,这一序列充当一个明显的“开关”。然而,这些隐藏基因并不遵循这些规则——它们以较短或更难检测的序列开始,因此很容易被忽略。尽管如此,它们仍然会产生RNA,后者可以作为模板用于制造蛋白质。
一些这些微蛋白已经被与癌症联系起来。例如,某些癌细胞已知含有数百种这些微型蛋白质。科学家怀疑,其中一些基因可能是由病毒引入我们的DNA中的,甚至可能是正常基因的“缺陷”版本。例如,研究中鉴定的一些蛋白质仅在癌变样本中发现,这表明它们相关的基因可能行为异常或不属于健康的人类基因组。
这些暗基因的发现不仅仅是一个令人着迷的科学突破——它可能对医学产生实际影响。由于许多这些微蛋白在疾病如癌症中活跃,它们可以用作新治疗方法的目标。目前,研究人员正在探索如何利用这些蛋白质进行癌症免疫疗法,即训练免疫系统识别和攻击癌细胞。这可能导致创新疗法,如针对这些隐藏角色的疫苗或细胞治疗。
这项研究提醒我们,我们对人类基因组的了解还远远不够。我们的遗传密码远非静态或完全理解,而是继续揭示其秘密,这要归功于技术进步和更深入的探索。随着我们将这些隐藏基因添加到我们的遗传“图书馆”中,我们为新的发现打开了大门,这些发现可能会重塑医学并加深我们对生命本身的理解。
论文摘要
方法
为了发现这些隐藏基因,研究人员分析了来自95,520个实验的数据,使用了质谱分析和免疫肽组学等先进工具。质谱分析将蛋白质分解成更小的部分以识别它们,而免疫肽组学则专注于免疫系统检测到的蛋白质片段。该研究还使用核糖体分析来识别正在被翻译成蛋白质的RNA活性区域。严格的质量检查确保了研究结果的准确性,包括将蛋白质片段手动验证与已知的DNA序列进行比对。
主要结果
研究发现,在分析的7,264个非典型开放阅读框(ncORFs)中,至少有25%在积极产生蛋白质。这为我们已知的编码蛋白质的序列目录增添了超过3,000个新基因,可能还有更多未被发现。大多数这些蛋白质出现在基因组的意外区域,并与癌症等疾病过程相关。免疫肽组学数据表明,这些微蛋白经常被免疫系统检测到,暗示它们可能在疾病检测和治疗中发挥关键作用。
研究局限性
研究面临挑战,因为ncORFs具有非常规特征,如小尺寸和不寻常的起始序列,这使得它们难以检测。此外,一些已识别的基因可能只在异常情况下(如癌细胞中)产生蛋白质,这引发了它们在正常人体生物学中的相关性问题。需要进一步的研究来确认这些蛋白质的功能角色并扩展其在基因组中的注释。
讨论与启示
该研究强调了我们对基因组理解的重大转变。通过揭示这些隐藏的编码蛋白区域,研究人员挑战了“垃圾DNA”的概念,揭示了一个比之前想象的更加复杂的动态基因组。这些发现可能彻底改变癌症研究,并导致针对这些微小蛋白质的新疗法。这项工作强调了继续完善研究基因组方法的重要性,因为很可能还有更多的发现有待发现。
资助与披露
该研究得到了国际协作的支持,涉及系统生物学研究所和其他全球研究中心。资金来自各种公共和私人机构。作者声明没有利益冲突。
(全文结束)

