根据一项新研究,一种新的人工智能(AI)工具可以从单个血液样本中同时评估感染、自身免疫疾病和疫苗反应。
该算法通过分析编码免疫细胞受体的基因来识别患有COVID-19、HIV、1型糖尿病、红斑狼疮、最近接种流感疫苗的患者以及健康对照组。这些受体序列是“潜在的诊断信息的独特来源”,斯坦福大学病理学教授Scott Boyd博士表示,“目前它们主要用于诊断由B细胞和T细胞衍生的癌症。”
这项于2月21日发表在《科学》杂志上的研究是一项概念验证,但该AI工具最终可以用于区分具有重叠症状的疾病,该研究的共同作者、斯坦福大学计算机科学博士后Maxim Zaslavsky补充道。
解码免疫系统的语言
这些B细胞和T细胞受体记录了身体的免疫活动。如果研究人员能够开发出一种有效读取这些反应的方法,那么“原则上,我们将拥有一个惊人的诊断工具,能够在一次测试中识别多种健康状况,”计算免疫学家Ramy Arnaout博士说。他是哈佛医学院病理学副教授兼波士顿贝斯以色列女执事医疗中心临床微生物实验室副主任,未参与此项工作。
然而,Arnaout解释说,对同一病原体的个体免疫反应可能会有很大差异。虽然它们可能有相似之处,但两个患有相同疾病的人具有相同的免疫细胞受体的情况非常罕见。
Zaslavsky说:“传统的测序方法有时难以将那些看起来略有不同但实际上识别相同目标的免疫受体归类在一起。” 大型语言模型(LLMs)——即ChatGPT背后的技术——“在这种任务上表现出色”。
Arnaout说:“这里的想法是,每个人的[B细胞和T细胞受体]组合就像同一种语言的不同方言。你说话的方式略有不同,这反映在这些序列的差异上。” 通过观察足够多来自患有相同疾病的不同人的免疫序列,LLMs可以“弄清楚这种语言是什么,从而理解这些方言。”
结合B细胞和T细胞数据
在这项研究中,Boyd、Zaslavsky及其同事结合了多个AI模型,分析了593名个体血液样本中的2350万个T细胞受体序列和1620万个B细胞受体序列。所有个体中,63人患有COVID-19,95人患有HIV,86人患有红斑狼疮,92人患有1型糖尿病,37人最近接种了流感疫苗,220人为健康对照组。
名为“机器学习免疫诊断”的算法在同时具备B细胞和T细胞受体数据的542个样本中表现最为准确,曲线下面积(AUROC)为0.986,准确率为85.3%。
仅使用B细胞受体进行筛查时,该AI工具的AUROC为0.959,准确率为74.0%。仅分析T细胞时,AUROC为0.952,准确率为75.1%。
Zaslavsky说:“之前的分析主要集中在B细胞或T细胞上,但我们看到了明确的证据,表明结合两者可以提供更全面的免疫活动全景图,因为这两个免疫系统分支是在协同工作的。”
B细胞受体序列在筛查COVID-19、HIV和流感疫苗接种方面更为有用,而红斑狼疮和1型糖尿病则具有更清晰的T细胞受体特征。
临床应用
尽管这样的工具离临床应用还有很长一段路要走,但“这是一个重要的进展,”Arnaout说。多重诊断测试——一种可以从单一样本中检测多个生物标志物的测试——可以帮助简化和缩短鉴别诊断过程。随着测序成本的不断降低,这种测试还可以节省成本,因为它可以减少对多次昂贵实验室检测的需求。
这些测试还有更广泛的应用,不仅限于诊断。类似于基因组测序如何推动某些癌症的靶向治疗,Zaslavsky希望免疫细胞受体测序也能在其他医学领域发挥类似作用。通过扫描免疫系统的底层活动,像这样的AI工具可能有助于识别自身免疫疾病的最有效治疗方法,并避免试错。
“这只是一个研究项目,但我们希望看到这种方法能否跟随测序技术进步的脚步,改变癌症治疗的方式。”
(全文结束)

