人工智能与病毒学的交汇点:变革性但潜藏风险The nexus of artificial intelligence and virology: transformative but with potential perils | BMJ Global Health

环球医讯 / AI与医疗健康来源:gh.bmj.com英国 - 英语2026-01-01 05:47:11 - 阅读时长13分钟 - 6483字
本文深入探讨了人工智能与病毒学交叉领域的最新突破及其潜在风险。文章指出,AI在蛋白质结构预测、高通量筛选、引导进化、宏基因组学和合成生物学等领域的应用正以前所未有的速度加速生物学发现和治疗开发,例如AlphaFold2在短短几年内预测了超过2亿个蛋白质结构。然而,这些技术也可能被滥用于设计更具毒力的病毒变体、逃避检测系统或合成新型生物武器。作者强调必须将安全措施直接整合到技术开发中,建立早期预警标准,发展基于蛋白质结构分析的新型检测能力,并通过全球合作和科学文化转变来平衡创新与安全,确保AI驱动的研究既能促进人类健康又能最小化潜在风险,这对维护生物安全格局至关重要。
人工智能病毒学蛋白质结构引导进化宏基因组学合成生物学抗病毒治疗生物安全生物威胁双重用途缓解策略
人工智能与病毒学的交汇点:变革性但潜藏风险

摘要要点

  • 分子生物学和计算生物学的进展正在快速融合。
  • 本评论讨论了病毒学与人工智能的交汇点。
  • 人工智能在病毒系统生物学中的应用具有显著益处,但也存在被滥用的潜在风险。

新兴科学

推进我们对基础生物学理解的工具已变得越来越能够应对大规模、多因素的问题,并以惊人的速度推导出解决方案(图1;科学基础)。

图1 人工智能驱动生物学的新兴科学:前景、风险与责任。

结构与互作组。新生合成的多肽链从核糖体出来后,会折叠成三维蛋白质结构。每种蛋白质都有一系列特定的形状(构象),这些形状将关键氨基酸聚集在一起,形成局部化学环境,如果蛋白质是酶,则促进特定反应的催化;如果蛋白质功能是通过分子间相互作用介导的,则形成与其他蛋白质、核酸或小分子配体结合的位点。因此,解决蛋白质结构是理解其功能以及设计结合并调节其活性的化合物(例如药物)的关键,这构成了构效关系研究的基础。高通量X射线晶体学、冷冻电子显微镜和核磁共振技术的进步已经产生了数十万个已解决的蛋白质结构。这些结构见解,加上质谱技术的发展,使得能够识别出成千上万的蛋白质-蛋白质和蛋白质-配体相互作用,这些相互作用调控生物活性。人工智能(AI),特别是深度学习,已成为建模蛋白质结构和相互作用的有力工具。AlphaFold和其他平台的开发使用计算策略来预测单个蛋白质的结构,以及蛋白质-蛋白质和蛋白质-配体复合物的结构,已经极大地加速了这些领域的研究。这些方法仍处于起步阶段,AI在这些策略中的应用将迅速扩展我们对蛋白质生物学的理解和操控。

高通量筛选。新平台如液滴微流控、单细胞转录组学和数字PCR允许并行测试数百万个反应,为大规模发现和选择策略提供了基础。液滴微流控允许生产数百万个皮升级别的液滴,这些液滴可作为微型试管。这些液滴可以被操作以允许插入反应试剂,并对特定产物进行筛选和分离。

引导进化。在高通量平台的基础上,引导进化能够选择具有增强活性的酶或逃避免疫中和的病毒变体。

由于可以在几小时内创建和测试数百万个液滴,微流控平台已被用于在试管中引导进化。例如,微流控技术已被用于选择和分离具有增强活性的酶,并识别逃避免疫中和的病毒变体。将AI应用于这些方法将加速识别和微调改善、抑制或改变蛋白质功能的药物或毒素的能力。由于许多病毒具有高突变率,开始评估病毒对治疗产生耐药性的机制也很重要,因为耐药性的快速出现可能会显著缩短抗病毒治疗的有效寿命。此外,AI辅助的定向进化将实现高通量选择策略,以改变病毒产量、细胞类型趋向性、宿主范围或毒力。

未知生物圈。地球上绝大多数生物对科学来说仍是未知的。大多数哺乳动物已被识别,可能大多数鸟类、鱼类和爬行动物也是如此;除此之外,覆盖范围是零散且远未完成的。关于微生物如单细胞真核生物、细菌、真菌和病毒的知识尤其匮乏。在这个未探索的生物宇宙中,可能有待发现的新药物、新化学物质和整个新行业。宏基因组学是一种强大的工具,用于识别组织或环境样本中存在的已知和未知生物。样本经过无偏深度测序,结果序列读数与包含所有已知物种样本序列的数据库进行计算比较。例如,大约有100,000种公认的病毒物种,其中约219种已知感染人类。这些可以通过宏基因组学轻松识别。然而,宏基因组研究显示,原始污水中超过99.9%的病毒是新的,而且目前尚不清楚它们的自然宿主是什么,或它们在生物或生态循环中扮演什么角色。其中大多数对人类或野生动物没有直接威胁,因此从这种病毒混合物中出现新的人类病原体的可能性非常低。然而,据估计,在任何时刻,地球上都有10^31种类型的病毒粒子,每秒发生约10^24次感染,主要涉及海洋中的蓝藻噬菌体。这些数字表明,新型病原体正在不断出现。AI已经改变了宏基因组数据获取和分析的速度和准确性。将AI应用于宏基因组学将导致识别许多目前未知的生物,组装它们的基因组,确定其蛋白质组的结构和功能,并推断它们在自然界中的作用。

合成生物学。在历史上,对生物学的了解主要是基于对自然界提供的蛋白质的研究。地球当前的泛蛋白质组是数十亿年进化的结果,这一过程由偶然性和环境驱动。未来的研究将把从自然世界获得的知识与合成生物学结合起来。在结构、互作组、筛选和引导进化的进步基础上,合成生物学能够设计出自然界中不存在的蛋白质和通路。AI驱动的方法开始能够设计出具有自然界中不存在功能的全新蛋白质和通路。这种思维方式已经应用于生物医学,如基因治疗和溶瘤病毒的开发。自然病毒进化可以导致抗体逃逸或宿主范围扩大,而合成生物学则为工程化病毒提供了独特可能性,这些病毒可以定制用于传递遗传指令或用于特定治疗目的。这种方法可以实现设计定制的新型病毒,这些病毒能够将遗传指令传递给特定细胞,或用于治疗目的的生物体。

由AI加速的蛋白质结构、引导进化、宏基因组学和合成生物学的融合,将改变生物发现、治疗以及我们对自然世界的理解。例如,AlphaFold2在短短几年内已经预测了超过2亿个蛋白质结构,而此前六十年仅通过实验解决了约20万个结构。最近,AI驱动的基因组语言模型和合成生物学的使用导致发现了一组具有更好杀菌特性的噬菌体,进一步巩固了这些技术为病毒学带来巨大进步的潜力。

威胁

AI辅助生物学的进步可能会被国家支持的组织、恐怖组织、小团体甚至个人以威胁社会的方式重新定向。本节描述了一些由AI和生物学的融合加速或促成的潜在威胁(图1;滥用可能性)。这一威胁分析仅限于病毒,但大多数相同原则适用于细菌、真菌和原生动物病原体。

修改已知人类病原体以增加毒力和/或逃避检测。创建新型病毒生物武器最直接的途径是修改已经是人类病原体的病毒。AI-生物学的融合可能被滥用,以生成逃避免疫中和或对现有抗病毒治疗具有抗性的已知病毒变体。例如,计算方法可能有助于预测病毒表面蛋白的变化,这些变化会减少抗体结合,同时保留受体相互作用。逃避免疫中和通常会带来病毒的适应度成本——也许逃避免疫中和的病毒具有更不稳定的附着蛋白或与受体的结合效率较低。AI方法可以解决这些问题,并提供如何使这些逃逸突变更被病毒耐受的路线图。

同样的方法可以用于生成逃避检测方法的病毒变体。病原体可以通过其基因组来识别。两种常见的方法是PCR和测序。这两种方法都需要了解特定病原体序列。病原体可以通过利用遗传密码的冗余性来操纵以逃避检测。因此,很容易生成基因组序列与已知病原体大相径庭但仍编码完全相同蛋白质组的病毒变体。这样的制剂将逃避大多数依赖核酸测序的检测方案,尽管保留了原始病原体的感染性。目前,这些制剂可以通过执行基因组六框翻译以生成潜在蛋白质产物并结合从序列读数组装的重叠群与蛋白质数据库比对的计算方法来检测。然而,反向蛋白质折叠和其他蛋白质设计策略可用于生成保留正常功能但具有根本改变的初级氨基酸序列的病毒蛋白质变体,这将逃避基于蛋白质或核酸序列的检测。检测这种制剂需要计算所有病毒蛋白质的结构并与结构数据库进行比较。

另一种滥用形式是将毒素或毒力基因插入感染人类但通常不致病的制剂的基因组中。例如,几乎所有人类都感染了多瘤病毒。这些病毒导致终身感染,但很少引起疾病。与许多病毒一样,多瘤病毒基因表达以广泛的剪接为标志,这个过程将被非编码序列(内含子)中断的不连续蛋白质编码序列(外显子)连接起来。因此,一些病毒基因通过重叠基因表达。毒素或毒力因子可以作为重叠基因插入,其编码序列被多个内含子中断。这样的制剂将逃避检测,因为基因的蛋白质编码部分在基因组中不是连续的。然而,这种制剂可以通过分析RNA-seq实验中六框翻译产物的结构来检测。

发现或合成新型人类病原体。新病毒物种的发现正在加速,预计这种趋势将持续下去。每种新病毒物种都有可能解锁新的生物学见解和应用。因此,每种新病毒也有可能被滥用。尽管已有完善的方法来识别和繁殖已知的人类病毒病原体,但从头创建新的人类病原体仍然很困难。限制病毒成为人类病原体的因素可能非常多样:无法在人体核心体温下良好复制、无法识别病毒细胞表面受体的人类版本,以及病毒蛋白质与人类蛋白质相互作用的无效性,这些都是潜在人类病原体必须克服的生物学限制的几个例子。AI驱动的病毒基因组学将增强识别可能感染并导致人类疾病的新型病毒的能力。它还可能提供蓝图或途径,通过这些途径可以对这些新型潜在病原体进行工程改造,以克服在人体中良好复制所需的一些限制。将宏基因组学、计算和微流控筛选相结合,可以筛选出感染人类细胞的病毒,然后对其进行修改以更好地感染人类,这可能被滥用来发现新的生物武器。

对病毒-宿主互作组及其如何贡献于病毒生命周期各阶段的知识的进步,最终将导致AI辅助的全新病毒设计。这样的病毒将真正新颖,因为它们在自然界中没有对应物。朝着这一目标的进展目前正由基因治疗和溶瘤病毒的研究推动。设计病毒的滥用潜力显而易见。

缓解策略

生物学和AI交叉领域出现的威胁,尽管目前主要是理论上的,但需要谨慎和积极的关注(图1;缓解和监督)。一个重要的步骤是将安全措施直接整合到正在开发的技术中。随着计算平台在设计或修改生物序列方面变得越来越强大,这些系统必须包含嵌入式过滤器,以筛查潜在危险的输出。这些保障措施可以依赖于已知病原体、毒素或免疫逃避标记的数据库,在实验室合成之前标记令人担忧的设计。随着工具的发展,它们自我调节和支持负责任使用的能力也必须发展。

在病毒学中使用AI的大多数研究人员可能没有完全意识到其研究中可能被用于设计增加生物威胁的病毒的方面,并认识到需要一定程度的指导或监督。制定帮助研究人员、机构和政策制定者早期识别危险信号的标准至关重要。这包括建立标准,用于识别何时提议的设计(如病毒序列或合成蛋白质)存在双重用途关切,即它可能既用于有益目的也用于有害目的。这些努力应建立在已经规范生物研究的监管框架基础上,如生物安全和生物安保协议,同时扩展它们以应对AI辅助设计带来的独特挑战。创建支持专家监督、鼓励内部审查和促进透明度的系统,有助于确保识别并讨论高风险工作。

除了预防之外,检测能力也必须发展。传统的基于序列的监测方法虽然强大,但可以通过巧妙的遗传变化来规避,这些变化在改变底层代码的同时保留蛋白质功能。为此,越来越需要包含蛋白质结构分析和功能预测的监测系统,以识别威胁,即使它们在序列水平上与已知病原体不相似。

就像网络安全一样,防御措施随着新攻击的发展而演变,对抗性AI的想法可能为思考生物学中更快、更适应性的保障措施提供有用的参考。

就像高风险生物制剂的获取仅限于具备适当能力和保障措施的实验室一样,高级生物设计工具的获取也应该谨慎管理。基于研究目的、机构生物安全能力和监督的分层系统,可以确保这些工具仅由准备负责任地使用它们的人使用。如果没有全球合作,这一切都将无效。科学和技术迅速跨越国界,管理它们的系统也必须如此。政府、学术机构和国际组织必须共同努力,为如何审查、监管、进行和传播高风险生物研究创建共同期望。对透明度和问责制的共同承诺对于防止滥用至关重要。

从长远来看,我们还必须促进科学文化本身的更广泛转变。推动发现的创造力和动力必须伴随着同等的责任感。在生物学前沿工作的研究人员不仅需要资源和工具,还需要支持,以批判性地思考其工作的影响。伦理、远见和关怀必须成为研究过程的一部分,就像好奇心和抱负一样。科学进步和公共安全并不冲突;它们相互依赖,当我们以谦逊和意图对待它们时,两者都会得到加强。

结论

AI辅助的蛋白质结构和生物化学、引导进化、宏基因组学和合成生物学的进步的融合,将促进并加速针对多种人类疾病的更好疗法的生成,但也可能被用于增强生物武器的有效性或降低对其检测的敏感性。更重要的是,这种融合可能会大大加速生成具有新型靶点和机制的新型生物武器类别。这些进展可能会从根本上改变生物安全格局,因此需要新型的检测和缓解模式。双重用途研究的困境——可以造福人类健康的研究生也可能被挪用来创造对人类健康构成更大风险的病毒——正迅速成为一个清晰而紧迫的问题,需要解决,以维持AI驱动研究的明确益处,同时最小化潜在风险。利用AI的力量帮助检测旨在恶意意图的研究,可以成为维持AI驱动研究益处同时最小化其被用于邪恶目的机会的有希望的策略。

参考文献

  1. Ocana A, Pandiella A, Privat C等。将人工智能整合到药物发现和早期药物开发中:一种变革性方法。Biomark Res 2025; 13。
  2. Shoemaker SC, Ando N。X射线在冷冻电子显微镜时代:结构生物学的动态未来。Biochemistry 2018; 57:277–85。
  3. Jumper J。Nature New Biol 2021; 596:583–9。
  4. van Kempen M, Kim SS, Tumescheit C等。使用Foldseek进行快速准确的蛋白质结构搜索。Nat Biotechnol 2024; 42:243–6。
  5. Stucki A, Vallapurackal J, Ward TR等。液滴微流控与酶的定向进化:交织的旅程。Angew Chem Int Ed Engl 2021; 60:24368–87。
  6. Agresti等。Proc Natl Acad USA 2010; 107:4004–9。
  7. Rotem A, Serohijos AWR, Chang CB等。RNA病毒在生物物理适应度景观上的进化。Mol Biol Evol 2018; 35:2390–400。
  8. Pavlopoulos等。Nature New Biol 2023; 622:594–602。
  9. Cantalupo PG, Calgua B, Zhao G等。原始污水含有多种病毒种群。MBio 2011; 2。
  10. Mushegian AR。地球上是否有10^31个病毒粒子,还是更多或更少?J Bacteriol 2020; 202:e00052–20。
  11. Suttle CA。海洋病毒——全球生态系统中的主要参与者。Nat Rev Microbiol 2007; 5:801–12。
  12. Kuhlman B, Dantas G, Ireton GC等。以原子级精度设计一种新型球状蛋白质折叠。Science 2003; 302:1364–8。
  13. Kortemme T。从新结构到可编程功能的从头蛋白质设计。Cell 2024; 187:526–44。
  14. Bulcha JT, Wang Y, Ma H等。基因治疗领域的病毒载体平台。Signal Transduct Target Ther 2021; 6。
  15. Shalhout SZ, Miller DM, Emerick KS等。溶瘤病毒治疗:进展与挑战。Nat Rev Clin Oncol 2023; 20:160–77。
  16. Martínez-Espinoza I, Bungwon AD, Guerrero-Plata A等。人偏肺病毒诱导的宿主microRNA表达损害巨噬细胞和上皮细胞中的干扰素反应。Viruses 2023; 15。
  17. Yang L, Li A, Wang Y等。肿瘤内微生物群:在癌症起始、发展和治疗效果中的作用。Signal Transduct Target Ther 2023; 8:35。
  18. Walsh ME。Risk Anal. 2025。

脚注

  • 处理编辑:Seema Biswas
  • 贡献者:所有作者SVK、DEN、AP和JMP对本文贡献相同。JMP是保证人。
  • 资金:作者未从公共、商业或非营利部门的任何资助机构声明对该研究的特定赠款。
  • 竞争利益:无声明。
  • 来源和同行评审:未委托;外部同行评审。

数据可用性声明

本工作中无数据。

伦理声明

患者出版同意:不适用。

伦理批准:不适用。

发表历史

  • 收到:2025年7月7日
  • 接受:2025年11月5日
  • 首次发表:2025年11月23日

【全文结束】

猜你喜欢
    热点资讯
    全站热点
    全站热文