在最近发表于《细胞》杂志的一项研究中,研究人员公布了一幅人类血浆蛋白质组图谱,该图谱涵盖了健康和疾病状态,为推进精准医疗提供了宝贵的资源。随着全球人口的快速增长和老龄化,改善健康状况和减轻疾病负担的需求日益增长。蛋白质是环境和遗传风险因素的生物效应器,直接反映了人体的病理生理变化和生物学过程。探索蛋白质与疾病之间的关系有助于表征疾病的生物标志物和健康状态。
高通量蛋白质组学的发展促进了对疾病机制的理解、风险预测、生物标志物的识别以及药物不良反应的早期检测。然而,大多数蛋白质组学研究主要集中在有限数量的疾病结果上。此外,尽管这些研究已经确定了一些特定疾病的蛋白质组学变化,但缺乏一个全面的蛋白质组-表型图谱来揭示不同疾病之间的共享生物学机制。
研究和发现
血浆蛋白质具有多种功能,包括运输脂质、激素、维生素和矿物质,以及在免疫反应、酶活性和血液凝固过程中发挥关键作用。
本研究呈现了一个大规模且全面的人类蛋白质组-表型关联图谱。研究人员系统地将2,920种血浆蛋白质映射到53,026名个体中的1,706种现患和新发疾病终点及986种健康相关特征。这是迄今为止最广泛的蛋白质组学调查之一。
现患和新发疾病分别定义为基线访视前后的疾病;血液样本和临床数据在这期间收集。首先,研究人员调查了2,920种蛋白质的循环水平与现患和新发疾病之间的关系。他们确定了168,100个显著的蛋白质-疾病对,其中包括107,158个蛋白质-新发疾病和60,942个蛋白质-现患疾病关联。
最高关联出现在新发泌尿生殖系统疾病中,这些疾病既包括已报告的蛋白质生物标志物,也包括未报告的蛋白质生物标志物。接下来,蛋白质根据p值进行排名,并计算每种蛋白质在多少种疾病中排名第一。前十名蛋白质中有六种在现患和新发疾病中均排名第一。
值得注意的是,27种蛋白质在现患和新发疾病中表现出不同的效应。例如,β-克洛索(KLB)、ADP-核糖转移酶3(ART3)和桥粒蛋白2(DSG2)在现患2型糖尿病(T2D)患者中的水平升高;然而,这些蛋白质被确定为新发T2D风险的保护因素。这表明这些蛋白质在不同的疾病阶段可能发挥相反的作用。
此外,研究人员还探讨了蛋白质与健康相关特征之间的关联。他们确定了554,488个显著的蛋白质-特征关联,涉及782个特征和2,702种蛋白质。由于大多数蛋白质显示出多表型关联,研究团队重点关注了多效性蛋白质,因为它们具有作为临床靶点的潜力。他们确定了649种与超过50种新发疾病相关的蛋白质和434种与超过50种现患疾病相关的蛋白质。
白蛋白占血浆蛋白质的55%,对于维持胶体渗透压至关重要,并作为脂质和类固醇激素运输的载体,维持生理平衡。
生长分化因子15(GDF15)与疾病关联最多(397种新发疾病和205种现患疾病)。在蛋白质-特征对中,365种蛋白质显示出超过300个显著关联,GDF15在蛋白质-特征关联中排名第二。此外,他们确定了某些蛋白质对特征有积极影响,并与疾病有保护性关联。
例如,胰岛素样生长因子结合蛋白2(IGFBP2)与降低2型糖尿病风险和降低丙氨酸氨基转移酶水平相关。功能富集分析显示,免疫系统相关途径,特别是肿瘤坏死因子(TNF)信号通路,在各种疾病中是最常被富集的途径。蛋白质代谢途径也在许多条件下显著参与。
预测和诊断潜力
接下来,研究团队通过建模每个终点的疾病风险,调查了蛋白质的预测和诊断价值。基于蛋白质的模型达到了较高的曲线下面积(AUC),超过0.8的疾病有92种,并对九种疾病表现出极佳的预测能力(AUC > 0.9)。与基于人口统计学的模型相比,蛋白质模型在预测361种疾病和诊断218种疾病方面显著更准确。将蛋白质与人口统计学数据结合,显著提高了417种疾病的预测准确性。
因果关系和药物发现
此外,研究团队进行了孟德尔随机化(MR)分析,以调查蛋白质是因果关系还是疾病的结果。他们确定了474个潜在的因果蛋白质-疾病对和4,014个可能是疾病结果的蛋白质变化对。最后,他们探索了与疾病相关的蛋白质,寻找有前景的药物靶点。
在蛋白质-新发疾病对和蛋白质-现患疾病对中,分别有38对和54对正在进行临床试验或已有批准的药物,且发现了37种已批准药物的再利用机会。潜在靶点的安全性分析显示,10个靶点的风险最低,26个靶点存在潜在风险,76个靶点存在可能风险。
主要创新和结论
该研究最重要的贡献是创建了一个开放访问的蛋白质组-表型资源,使研究人员能够探索详细的蛋白质-疾病和蛋白质-特征关联、富集的生物学途径以及诊断/预测模型。这一交互式工具有望加速精准医学的研究。
总的来说,这项关于健康和疾病表型的大规模血浆蛋白质组学研究确定了168,100个蛋白质-疾病关联和554,488个蛋白质-特征关联。研究表明,基于血浆蛋白质的模型在疾病预测和诊断方面优于传统的基于人口统计学的模型。此外,确定了474个潜在的因果蛋白质,为治疗提供了有前景的靶点。
局限性
作者承认了几项局限性,如依赖血浆样本和研究队列的多样性有限,主要是白人欧洲人。未来的研究应验证更多样化人群中的发现,并探索组织特异性蛋白质组学数据,以更深入地了解疾病发病机制。
期刊参考:
邓永涛, 余杰, 何燕, 等. 53,026名成年人健康与疾病中的血浆蛋白质组图谱. 《细胞》, 2024, DOI: 10.1016/j.cell.2024.10.045,
(全文结束)