AI 革新罕见病药物发现
摘要: 一种 AI 工具已经为超过 17,000 种罕见和未治疗疾病识别了药物候选物,为数百万受影响的个体带来了希望。这个工具,TxGNN,是第一个专门开发用于重新利用现有药物治疗被忽视疾病的模型。它预测哪些药物可能有效以及潜在的副作用,提供了新的治疗途径。该 AI 模型免费使用,旨在加速患者所需的治疗发现。
关键事实:
- TxGNN 为超过 17,000 种疾病识别了药物候选物,包括未治疗的疾病。
- 该模型使用现有药物建议新的治疗方法,降低成本和时间。
- 与之前的模型相比,它在识别药物候选物方面有效率提高了 50%。
全球有超过 7,000 种罕见和未诊断的疾病。尽管每种疾病只影响少数个体,但这些疾病在全球范围内影响约 3 亿人,因此对人类和经济造成了巨大的负担。然而,仅有 5% 到 7% 的这些疾病有 FDA 批准的药物,因此大多数疾病仍然未得到治疗或治疗不足。开发新药是一个艰巨的挑战,但一种新的 AI 工具可以推动从现有药物中发现新疗法,为患有罕见和被忽视疾病的患者及其治疗医生带来希望。
新工具有两个核心功能:一个用于识别治疗候选物及其可能的副作用,另一个用于解释决策的理由。该 AI 模型称为 TxGNN,是第一个专门开发用于识别罕见疾病和无治疗条件的药物候选物的模型。它从现有药物中为超过 17,000 种疾病识别了药物候选物,其中许多疾病没有任何现有的治疗方法。这代表了迄今为止任何单一 AI 模型能够处理的最大疾病数量。研究人员指出,该模型可以应用于更多疾病,而不仅仅是初始实验中处理的 17,000 种疾病。这项工作于 9 月 25 日发表在《自然医学》上,由哈佛医学院的科学家领导。
研究人员免费提供该工具,并鼓励临床科学家在寻找新疗法时使用它,特别是对于没有或治疗选择有限的条件。“我们希望通过这个工具在疾病谱系中识别新的疗法,但在罕见、超罕见和被忽视的条件下,我们预见到这个模型可以帮助缩小或至少缩小导致严重健康不平等的差距,”主要研究员 Marinka Zitnik 说,她是 HMS 布拉瓦尼克研究所生物医学信息学助理教授。“这正是我们在减少全球疾病负担、发现现有药物的新用途方面的前景所在,这也是比从头设计新药更快、更经济的方式,”Zitnik 补充道,她还是哈佛大学肯普纳自然和人工智能研究所的副教授。
新工具有两个核心功能:一个用于识别治疗候选物及其可能的副作用,另一个用于解释决策的理由。该工具从近 8,000 种药物(包括 FDA 批准的药物和目前处于临床试验阶段的实验药物)中为 17,080 种疾病识别了药物候选物,包括没有可用治疗的条件。它还预测了特定条件下药物的副作用和禁忌症——这是当前药物发现方法在早期临床试验中主要通过试错来确定的。
与领先的药物再利用 AI 模型相比,新工具在识别药物候选物方面平均表现更好,几乎提高了 50%,并且在预测哪些药物会有禁忌症方面准确率提高了 35%。
使用已批准药物的优势
重新利用现有药物是一种吸引人的新治疗方法,因为它依赖于已经研究过、具有明确安全性的药物,并且已经通过了监管审批过程。大多数药物除了其最初开发和批准的具体目标外还有多种效果。但许多这些效果在最初的测试、临床试验和审查期间未被发现或研究,只有在数百万人的多年使用后才显现出来。事实上,近 30% 的 FDA 批准的药物在初次批准后获得了至少一个额外的治疗适应症,许多药物在多年间获得了数十个额外的治疗适应症。这种药物再利用的方法最多只能说是随机的。它依赖于患者报告的意外有益副作用或医生对是否将药物用于其未指定条件的直觉,这种做法被称为超说明书使用。“我们倾向于依赖运气和偶然性而不是策略,这限制了药物发现仅限于已经有药物存在的疾病,”Zitnik 说。Zitnik 指出,药物再利用的好处不仅限于没有治疗方法的疾病。“即使对于已有批准治疗的更常见疾病,新药物也可以提供副作用更少或替代对某些患者无效的药物的选择,”她说。
新 AI 工具为何优于现有模型
目前用于药物发现的大多数 AI 模型都是针对单一疾病或少数几种条件进行训练的。而新工具则是以一种使其能够利用现有数据进行新预测的方式进行训练的。它通过识别多种疾病之间的共享特征(如共享基因异常)来实现这一点。例如,AI 模型基于常见的基因基础识别共享的疾病机制,这使它能够从已知治疗方法的疾病推断到未知治疗方法的疾病。研究团队表示,这种能力使 AI 工具更接近于人类临床医生可能会使用的推理方式,如果他们能够访问 AI 模型拥有的所有现有知识和原始数据,而这些数据是人类大脑无法访问或存储的。
该工具是在大量数据上进行训练的,包括 DNA 信息、细胞信号传导、基因活性水平、临床记录等。研究人员通过要求它执行各种任务来测试和改进模型。最后,该工具的性能通过 120 万患者的记录进行了验证,并要求它为各种疾病识别药物候选物。研究人员还要求该工具预测哪些患者特征会使识别的药物候选物对某些患者群体禁忌。另一项任务是要求该工具识别可能有效阻断某些疾病通路和过程中的蛋白质活性的现有小分子。
为了评估模型的推理能力,研究人员要求模型为三种它在训练中未见过的罕见疾病找到药物:一种神经发育障碍、一种结缔组织疾病和一种导致水失衡的罕见遗传疾病。然后,研究人员将模型推荐的药物治疗方案与当前医学知识关于这些药物如何工作的信息进行了比较。在每个例子中,工具的推荐都与当前医学知识一致。此外,该模型不仅为所有三种疾病识别了药物,还提供了其决策背后的理由。这一解释功能增加了透明度,可以提高医生的信心。研究人员警告说,模型识别的任何疗法都需要进一步评估剂量和给药时间。但他们补充说,凭借这种前所未有的能力,新的 AI 模型将以以前不可能的方式加快药物再利用。研究团队已经开始与多个罕见疾病基金会合作,帮助识别可能的治疗方法。
作者、资助、披露
合著者包括 Kexin Huang、Payal Chandak、Qianwen Wang、Shreyas Havaldar、Akhil Vaid、Jure Leskovec、Girish N. Nadkarni、Benjamin S. Glicksberg 和 Nils Gehlenborg。
资助: 该研究得到了国家科学基金会 CAREER 奖(拨款 2339524)、国立卫生研究院(拨款 R01-HD108794)、美国国防部(拨款 FA8702-15-D-0001)、亚马逊教员研究计划、谷歌研究学者计划、阿斯利康研究计划、罗氏杰出科学家联盟、赛诺菲 iDEA-TECH 奖、辉瑞研究计划、陈扎克伯格倡议、HMS John 和 Virginia Kaneb 奖学金、Biswas 家族基金会转化计算生物学拨款(与米尔肯研究所合作)、HMS 院长创新奖(用于人工智能应用)、哈佛大学肯普纳自然和人工智能研究所、HMS Susanne E. Churchill 夏季生物医学信息学研究所的支持。
(全文结束)

