人工智能有望在未来几年通过改善决策、自动化重复性流程以及加速关键研究来彻底改变制药和医疗保健行业。人们对这一技术的兴趣无疑正在增长,GlobalData对198家制药公司的调查显示,他们投票认为人工智能将是"对制药行业最具颠覆性的技术"。
特别是,人工智能可以减少分析和处理数据所需的时间。大多数科学家仍然花费近一半时间"处理"数据,这使他们无法揭示有价值的见解。人工智能在推动精准医学和基因组测序方面特别有用,因为在这些领域有大量科学文献和真实患者数据,分析这些数据可能会带来有价值的发现。
文本挖掘和自然语言处理(NLP)等人工智能方法在寻找罕见疾病新治疗方法方面特别有益。一个很好的例子是Elsevier与辛尔吉亚联盟(苏黎世大学儿童医院DMG/DIPG中心;苏黎世联邦理工学院;挪威分子医学中心)以及开放儿科脑肿瘤图谱项目之间的最新合作项目。
构建人工智能疾病模型
该项目旨在为弥漫性内生性桥脑胶质瘤(DIPG)开发一个人工智能疾病模型,这是一种特别具有侵袭性的儿童脑肿瘤。目前,DIPG没有有效治疗方法,儿童确诊后的典型预期寿命仅为8至11个月。
疾病模型有助于理解特定疾病如何发展(例如风险因素或触发因素),并能够改进治疗方法的测试。DIPG项目旨在开发一种模型,该模型将使用NLP和机器学习来识别可能用于重新用途的FDA批准药物。初始模型是使用Elsevier的生物学知识图谱和补充软件构建的,这些软件分析了来自DIPG真实患者的"组学数据"(基因组学、蛋白质组学、代谢组学、宏基因组学和转录组学)。
发现肿瘤如何突变
通过分析患者组学数据,研究团队能够检查蛋白质活性并识别DIPG肿瘤中最活跃的基因。然后,他们将最活跃的蛋白质映射到由Hanahan & Weinberg提出并由Elsevier科学家开发的癌症标志模型上,以了解导致肿瘤生长的驱动突变。该项目还使用现有科学文献的文本挖掘来扩展癌症标志集合,并将突变与最活跃的通路联系起来。这有助于更好地理解疾病机制并找到更好的药物。
为了进一步训练人工智能疾病模型,费城儿童医院开发了基于云的平台Cavatica,其中包括30多名DIPG患者的数据——表明遗传突变和基因表达。每位患者的数据规模巨大,包含3,000至5,000个突变以及癌症患者中另外2,000至3,000个遗传突变。由于这超出了人工筛选的能力范围,人工智能能够帮助分析数据,并发现所有30名DIPG患者中活跃的两个主要癌症标志——这可能有助于找到新的有效治疗方法。
使用疾病模型寻找潜在药物候选者
一旦算法揭示了导致肿瘤形成的蛋白质,下一步就是发现抑制这些蛋白质活性的药物。最初发现了637种药物,但随后使用NLP(应用Elsevier的人工智能深度阅读和文本挖掘)将这些药物缩小范围,以寻找专门抑制称为TP53的突变的药物。
最后,利用该模型寻找抑制疾病机制的FDA批准药物,因为使用预先批准的药物意味着可以更快地将新治疗带给患者。为了找到最具实验验证潜力的十种药物,开发了进一步的药物排名评分。在审查药物时,一个关键问题是毒性,尤其是对于DIPG患者通常在五至十岁之间的儿童。PharmaPendium的数据被用来获取所发现药物的毒性特征。
成果与人工智能的未来
DIPG的人工智能疾病模型目前有19条通路,每条通路都专门用于细胞类型、生物过程、细胞分化状态和疾病状态。该项目发现了212种可以逆转疾病状态下蛋白质活性的药物,其中25%的药物可以通过四种不同机制抑制突变TP53。
这只是一个人工智能如何推进药物发现和治疗罕见疾病的例子,但这项工作也可以提供一个应用于其他疾病领域的模型。当这个模型最终扩展时,人工智能将允许对各种罕见疾病采取进一步的精准医学方法。
人工智能无疑将在生命科学研发的未来发挥关键作用。然而,当今的现实是,生命科学才刚刚触及人工智能与人类智慧相结合所能做的事情的表面。随着更多此类用例被带入聚光灯下,组织将更快地认识到这些好处——帮助我们增进对疾病的理解,并更快地为患者提供重要的治疗。
安东·尤里耶夫博士是Elsevier的专业服务总监,专注于通过咨询、定制软件开发和定制分析来开发满足客户需求的生物信息学解决方案。他目前的研究重点是研究生物网络的拓扑和进化特性,以及开发用于通路重建的算法和工作流程。
【全文结束】

