超过161,000种RNA病毒已被发现,这展示了广泛的未探索病毒多样性,并为进一步的科学突破奠定了基础。图片来源:SciTechDaily.com
最大规模的新病毒物种发现揭示了隐藏的病毒圈。
人工智能(AI)被用于揭示生活在我们脚下和全球每个角落的一种多样化和基本的生命分支的细节。这些病毒不仅在人类健康中扮演着重要角色,而且在极端环境中也普遍存在,突显了它们在生态系统中的关键作用,并提供了对病毒进化和多样性的见解。
使用机器学习工具,研究人员发现了161,979种新的RNA病毒,这一突破性发现可以显著增强我们对地球生物多样性的理解,并有助于识别数百万种尚未表征的病毒。这项研究于10月9日发表在《细胞》杂志上,由一个国际研究团队进行,是迄今为止发表的最大规模的病毒物种发现论文。
“我们被提供了一个窗口,让我们得以窥见地球上一个隐藏的生命部分,揭示了令人惊叹的生物多样性。”悉尼大学医学与健康学院医学科学系的资深作者爱德华兹·霍姆斯教授说,“这是单个研究中发现的新病毒物种数量最多的一次,极大地扩展了我们对周围病毒的了解。一次性发现这么多新病毒令人震惊,这只是冰山一角,开启了一个发现的世界。还有数百万种病毒等待发现,我们可以应用同样的方法来识别细菌和寄生虫。”
极端环境中的RNA病毒角色
尽管RNA病毒通常与人类疾病相关,但它们也存在于世界各地的极端环境中,可能在全球生态系统中发挥关键作用。在这项研究中,它们被发现在大气、温泉和热液喷口中生活。“极端环境携带如此多类型的病毒,只是它们在最恶劣条件下生存的非凡多样性和顽强生命力的又一例证,可能为我们提供线索,了解病毒和其他基本生命形式是如何形成的。”霍姆斯教授说。
通过AI推进病毒鉴定
研究人员构建了一种深度学习算法LucaProt,用于计算大量遗传序列数据,包括长达47,250个核苷酸的病毒基因组和复杂的基因组信息,从而发现了超过160,000种病毒。“绝大多数这些病毒已经被测序并存储在公共数据库中,但由于它们的差异性太大,没有人知道它们是什么。”霍姆斯教授说,“它们构成了通常所说的‘暗物质序列’。我们的AI方法能够组织和分类所有这些分散的信息,首次揭示了这种‘暗物质’的意义。”
未来方向和AI在病毒学中的应用
该方法能够显著加快病毒发现的速度,而使用传统方法则会非常耗时。中山大学的共同作者、该研究的机构负责人施莽教授表示:“我们过去依赖繁琐的生物信息学管道进行病毒发现,这限制了我们可以探索的多样性。现在,我们有了一个更有效的基于AI的模型,具有极高的灵敏度和特异性,同时允许我们更深入地探索病毒多样性。我们计划将这个模型应用于各种应用中。”
阿里巴巴云智能达摩院的研究员李兆荣博士说:“LucaProt代表了尖端AI技术和病毒学的重要结合,证明了AI可以有效地完成生物探索任务。这种结合为从新视角解码生物序列和拆解生物系统提供了宝贵的见解和鼓励。我们还将继续在AI病毒学领域进行研究。”
霍姆斯教授说:“显而易见的下一步是训练我们的方法,发现更多这种惊人的多样性,谁知道还会有什么额外的惊喜等着我们。”
参考文献:《使用人工智能记录隐藏的RNA病毒圈》作者:侯欣、何勇、方潘、梅世强、徐瓒、吴伟辰、田军华、张顺、曾振宇、苟秦玉、辛艮阳、乐诗嘉、夏银月、周雨兰、惠凤鸣、潘元斐、John-Sebastian Eden、杨赵晖、韩冲、舒跃龙、郭德银、李俊、Edward C. Holmes、李兆荣和施莽,2024年10月9日,《细胞》。DOI: 10.1016/j.cell.2024.09.027
研究人员声明没有竞争利益。该研究得到了中国国家自然科学基金、深圳市科技计划、广东省自然科学基金、广东省“珠江人才计划”创新创业团队项目、香港创新及科技基金(ITF)和医疗卫生研究基金的支持。霍姆斯教授由澳大利亚国家卫生和医学研究委员会的调查员资助和由香港特别行政区创新及科技委员会管理的AIR@InnoHK资助。
(全文结束)

