抗体药物已经重塑了我们治疗疾病的方式。通过利用免疫系统来摧毁肿瘤或抑制自身免疫疾病中的过度炎症反应,这些疗法已成为现代医学中不可或缺的工具。它们的独特属性,如高特异性和调动免疫系统的能⼒,使以前无法治疗的病症取得了突破性进展。
尽管取得了成功,但大多数抗体药物仍局限于失活、靶点抑制或将免疫功能招募到特定部位。这使得其大部分潜力尚未被发掘。能够激活或调节靶标活性的功能性活性抗体代表着新的前沿领域。这些抗体可以通过获得新的治疗机制来满足未满足的需求,但它们的发现极其困难。解锁这些变革性的药物需要超越传统发现方法,转向利用高通量功能测定技术生成用于机器学习(ML)所需的大型数据集。
抗体药物的前景
抗体是免疫系统的重要组成部分,进化出中和病原体、毒素和外来分子的能力。它们的可变区域能精确结合目标,而恒定区域则招募免疫反应以消除威胁。
抗体药物利用这些结合和免疫相关功能来对抗各种疾病。从第一个单克隆抗体muromonab-CD3(用于器官移植排斥反应)开始,这些疗法已扩展到肿瘤学、自身免疫疾病和传染病。在癌症中,抗体可以直接靶向肿瘤细胞进行破坏(例如,抗体-药物偶联物)或放大免疫反应(例如,ADCC、CDC、双特异性抗体)。在自身免疫疾病中,它们选择性地阻断促炎信号或受体活动,在不广泛抑制免疫系统的情况下阻止疾病进展。最近,抗体在对抗病毒感染(包括COVID-19)方面发挥了关键作用,其精确性和可扩展性证明了这一点。
作为药物模式,抗体比传统的小分子或肽具有明显的优势。它们的特异性减少了脱靶效应,提高了安全性。它们的大尺寸和结构复杂性使其能够与多样化的蛋白质表面相互作用,包括小分子药物无法接触的复杂靶标。此外,抗体安全代谢且半衰期长,减少了给药频率,使其成为慢性病的理想选择。
当前抗体发现的方法和挑战
抗体发现涉及寻找具有所需特性(如高亲和力或生物活性)的序列。传统方法如杂交瘤技术(通过分离免疫小鼠产生的抗体)仍然是基础。在这里,哺乳动物免疫系统通过体细胞超突变等过程自然优化抗体的特异性和亲和力。这一方法得到了噬菌体和酵母展示技术的补充,这些技术允许在体外筛选大型文库以识别结合物。最近的进展扩展了这些方法,如引入产生人类抗体库的转基因动物和优化多样性的合成文库。这些创新增加了潜在候选者的数量,提高了发现命中率的可能性。
然而,这些方法主要侧重于寻找高亲和力的结合物,而不是具有强大功能的抗体。这种局限性源于抗体的天然功能:它们进化为中和病原体,而不是诱导治疗靶标的结构变化。能够调节信号传导或激活通路的功能性抗体需要完全不同的发现方法。
为了识别这些罕见的功能性抗体,研究人员依赖于功能筛选方法,如基于细胞的测定或体外重建系统,这些系统模拟靶标通路。这些测定测量受体激活或抑制等活动,提供抗体结合的生物学效应见解。扩大这些方法对于找到罕见的命中至关重要。
微流控技术和液滴系统等技术进一步提高了通量,使研究人员能够筛选数百万个变异体以寻找功能。合成生物学进一步推动了边界,通过工程细胞报告数亿个抗体变异体的功能活性。
规模的重要性
功能性活性抗体极为罕见。在庞大的潜在抗体序列池中,只有极小部分会与靶标相互作用,而在这些相互作用中,只有少数会引起结构变化并改变靶标活性。例如,要激活G蛋白偶联受体(GPCRs),一种常见但难以用抗体靶向的靶标类,抗体结合需要模仿天然配体结合,或以精确的相对方向结合多个变构位点,以促进细胞内侧的活性构象。这类抗体非常难以识别,因为它们通常不具备最高亲和力的相互作用,因此会被基于亲和力的发现方法遗漏。高通量活性测量对于揭示这些难以捉摸的候选者至关重要。
令人鼓舞的是,在更易接近的靶标类别(如受体酪氨酸激酶和细胞因子受体)方面已经取得了一些进展。这些蛋白质通过二聚化或聚集激活,而不是精确的结构修饰。它们具有较大的细胞外结构域,更容易找到与之结合的抗体;这些结合抗体的片段可以组合,例如在双特异性抗体格式中,在结合时聚集这些受体并激活它们,类似于天然配体的作用。
AI在抗体发现中的力量
数据和计算的交叉正在改变抗体发现。AI算法可以处理大量数据,发现模式并预测结果,使其非常适合探索庞大的抗体序列组合空间。通过整合结合、结构和活性的数据,AI可以促使从使用数据进行发现(本质上是一个概率过程)转变为使用数据进行设计(一个有意图的工程过程)。在90年代末,蛋白质结构预测是生物学中最后一个未解难题之一。像AlphaFold这样的突破展示了AI预测蛋白质结构的前所未有的准确性。现在,AI正被用来生成能够结合预期靶标的“de novo”抗体。即使只有一部分生成的抗体结合物在实验上得到验证,这一事实本身就是一个惊人的成就。
然而,预测活性抗体序列仍然是一个开放的挑战。虽然将序列映射到结构和结构映射到相互作用变得可行,但预测能够实现功能结果的序列要复杂得多。活性取决于动态蛋白质结构及其之间的相互作用,这些相互作用受到多种生物因素的影响。
高质量的活性数据是关键瓶颈。AlphaFold之所以有效,是因为它训练于巨大的公共数据集,如蛋白质数据库(PDB)。自然语言处理和图像识别也因大量公开可用的文本和图像数据而被AI“解决”。同样,抗体机器学习模型需要大量高质量的训练数据集,将序列、结构和活性联系起来。大多数活性测定生成的数据远少于蛋白质机器学习模型所需的数千万个参数。只有最近,基于细胞的技术才开始生成数亿个活性数据点,足以训练预测模型。数据,而非计算能力,是解锁下一代激活和调节抗体的关键。
前进的道路
尽管仍然存在挑战,但功能性活性抗体的潜力巨大。这些药物通过调节以前其他药物模式无法触及的生物通路,为治疗以前无法治愈的疾病提供了解决方案。通过结合传统的抗体工程、合成生物学和先进的计算建模,研究人员正在开发能够应对最具挑战性的生物靶标和复杂疾病的技术。
(全文结束)

