新型AI工具ShortStop助力基因组微蛋白搜寻New AI Tool, ShortStop, Searches the Genome for Microproteins

环球医讯 / AI与医疗健康来源:www.genengnews.com美国 - 英语2025-08-05 17:48:27 - 阅读时长3分钟 - 1078字
索尔克研究所开发的机器学习工具ShortStop通过基因组扫描发现210个潜在微蛋白候选物,其中COL1A1-MP微蛋白可能成为肺癌生物标志物。该技术通过标准化负训练数据集,突破了传统方法在微蛋白鉴定中的局限性,为阿尔茨海默病、肥胖等疾病研究提供新路径。
健康疾病微蛋白ShortStop基因组肺癌阿尔茨海默病肥胖症治疗靶点生物标志物
新型AI工具ShortStop助力基因组微蛋白搜寻

蛋白质维系生命运转,在人体结构和功能中发挥着重要作用。但这些大分子的光环掩盖了一类名为微蛋白的小型蛋白家族。微蛋白隐藏在99%被认定为"非编码"的DNA区域,尽管体积微小,它们对健康和疾病的影响却不容忽视。

索尔克研究所科学家开发出名为ShortStop的计算工具,首次系统性探索基因组暗区的微蛋白。该工具能分析遗传数据库,定位可能编码微蛋白的DNA序列,并预测具有生物学意义的目标蛋白,显著提升健康与疾病相关微蛋白的发现效率。通过肺癌数据集验证,该工具已发现210个新的微蛋白候选物,包括一个可验证的COL1A1-MP微蛋白,未来可能成为重要治疗靶点。

"人体中大部分蛋白质已被充分研究,但最新发现表明我们遗漏了数千个隐藏的小型微蛋白。"索尔克研究所教授Alan Saghatelian表示,"传统方法仅关注编码大蛋白的DNA区域,而我们正在重新认知这些'垃圾DNA'区域的重要性——它们产生的微蛋白可能在健康调节中发挥关键作用。"

在《BMC方法》期刊发表的研究中,研究团队指出ShortStop解决了微蛋白研究的两大难题:缺乏可扩展的表征工具和标准化负训练数据集。相较于常规蛋白质数百至上千个氨基酸的长度,微蛋白通常不足150个氨基酸,这使其难以通过传统方法检测。尽管人类UniProt/Swiss-Prot数据库收录了2万余个蛋白质,但仅有约10%属于微蛋白。

ShortStop通过计算框架革新传统工作流程,其核心技术在于基于机器学习系统的双分类机制。该系统采用计算机生成的随机smORFs作为阴性对照数据集,能够将微蛋白分为功能性和非功能性两类。研究人员将新发现的smORFs与虚拟样本比对,快速判定其功能性概率。

"ShortStop的神奇之处在于它能兼容RNA测序等通用数据类型。"研究第一作者Brendan Miller博士表示,"这让我们可以大规模筛查健康与病变组织中的微蛋白,为癌症和阿尔茨海默病研究开辟新路径。"在肺癌肿瘤与正常组织的对比研究中,团队发现COL1A1-MP微蛋白在肿瘤组织中显著高表达,提示其作为生物标志物的潜力。

研究团队强调,ShortStop并非独立解决方案,而是帮助研究人员优先筛选功能研究候选对象的计算框架。该工具为微蛋白发现提供了系统方法,既支持功能性研究优先排序,也为领域方法开发和基准测试奠定基础。目前索尔克研究所团队正利用该工具分析阿尔茨海默病和肥胖症相关数据,期待更多突破性发现。

【全文结束】

大健康

猜你喜欢

  • 阿尔茨海默症“神药”可延缓疾病进展四年,甚至可能逆转病情阿尔茨海默症“神药”可延缓疾病进展四年,甚至可能逆转病情
  • 认知障碍:类型、症状与成因认知障碍:类型、症状与成因
  • 阿尔茨海默病:病因、症状、检测与治疗阿尔茨海默病:病因、症状、检测与治疗
  • 什么是CTE,这种与头部创伤相关的脑部疾病?什么是CTE,这种与头部创伤相关的脑部疾病?
  • 医生警告儿童罕见流感并发症导致脑肿胀病例上升医生警告儿童罕见流感并发症导致脑肿胀病例上升
  • 睡眠不足如何影响你的心脏健康睡眠不足如何影响你的心脏健康
  • B族维生素对大脑与心脏健康的影响B族维生素对大脑与心脏健康的影响
  • 阿尔茨海默病的阶段 - 早期、中期、晚期痴呆症状阿尔茨海默病的阶段 - 早期、中期、晚期痴呆症状
  • 开发新治疗方案开发新治疗方案
  • 确定衰老大脑的关键标志确定衰老大脑的关键标志
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康