基于CNN的单细胞转录组学习揭示可血液检测的多癌症脑转移特征CNN-based learning of single-cell transcriptomes reveals a blood-detectable multi-cancer signature of brain metastasis

环球医讯 / AI与医疗健康来源:elifesciences.org丹麦 - 英语2026-01-09 01:31:55 - 阅读时长32分钟 - 15543字
本研究通过整合六种癌症类型的单细胞RNA测序数据,利用ScaiVision监督表示学习方法识别出与脑转移相关的跨癌症基因表达特征。该特征在单细胞分辨率上定义,具有高预测准确率,并可在患者血液中的肿瘤教育血小板中检测到,为非侵入性脑转移早期诊断提供了潜在生物标志物,有望改善脑转移患者的预后评估和治疗策略,对推动癌症精准医疗具有重要临床意义。
脑转移单细胞转录组CNN肿瘤教育血小板VEGF信号传导ETS1Pazopanib生物标志物跨癌症特征可解释机器学习
基于CNN的单细胞转录组学习揭示可血液检测的多癌症脑转移特征

摘要

脑转移(BrM)是晚期癌症的严重并发症,在临床症状出现前难以预测。为研究不同类型肿瘤中BrM的共同转录特征,我们整合了来自六种癌类型(包括肺、乳腺、结直肠、肾、前列腺和黑色素瘤)的恶性上皮细胞的单细胞RNA测序(scRNA-seq)数据。我们应用ScaiVision(一种监督表示学习方法)根据BrM状态对肿瘤样本进行分类。该模型在所有六种癌症类型中均实现了高预测准确率(ROC曲线下面积>0.90)。该分析确定了一个与BrM相关的、在单细胞分辨率上定义的跨癌症基因表达特征。为评估该特征的临床相关性,我们检测了有无BrM患者的血液样本中肿瘤教育血小板(TEPs)是否存在该特征。该特征可在血小板RNA中检测到,并能区分有BrM和无BrM的患者,表明BrM相关表达程序的特征反映在血液来源的材料中。这些发现证明,可以使用scRNA-seq和基于神经网络的分析在多种肿瘤类型中识别脑转移的转录特征。在TEPs中检测到该特征支持其在非侵入性环境中的相关性,并为进一步研究其在BrM风险评估中的效用提供了基础。

引言

脑转移(BrM)是最常见的颅内肿瘤,在约20%的成年癌症患者中发生。它们是系统性恶性肿瘤的毁灭性并发症,治疗选择有限且生存结果不佳。大多数BrM源自肺癌、乳腺癌、黑色素瘤和其他实体瘤,其发展通常预示着神经功能衰退和不良预后。尽管癌症治疗有所改进,但有效预测、检测或预防BrM的方法仍然是未满足的临床需求。特别是,缺乏用于早期识别有BrM风险患者的可靠生物标志物,阻碍了及时干预和监测策略。这种临床负担和诊断缺口凸显了对BrM发病机制和转移潜力标志物进行更深入生物学洞察的紧迫性。

单细胞RNA测序(scRNA-seq)的最新进展已开始表征BrM的细胞和分子结构,但知识缺口仍然很大。单细胞方法允许高分辨率剖析肿瘤微环境,揭示有助于脑转移定植的各种细胞类型和状态。值得注意的是,新兴的scRNA-seq研究已发现不同癌症的BrM中某些保守的基质和免疫特征。例如,脑转移病灶内的癌症相关成纤维细胞表现出异常保守的激活谱,其特征是丰富的I型胶原和伤口愈合特征,反映了原发肿瘤中观察到的纤维化程序。同样,BrM中的转移相关髓系细胞(包括驻留的小胶质细胞和浸润的巨噬细胞)通常会收敛到共享的表型状态;例如,在各种起源的脑转移中观察到共存的促炎(M1样)和免疫抑制(M2样)巨噬细胞亚群。这些保守的成纤维细胞和巨噬细胞反应表明,不同肿瘤类型在定植大脑时会共同利用平行的微环境程序。然而,将这些生物学见解转化为临床诊断或治疗方法并非易事。特别是,问题仍然是如何利用单细胞发现来识别BrM的预测标记,以便在转移灶在临床上明显之前。

考虑到BrM源自多种肿瘤谱系,多癌症方法对这个问题特别有价值。迄今为止,许多BrM研究都是按癌症类型划分的,例如分别关注肺癌或乳腺癌中的BrM。虽然这些研究已产生重要的肿瘤特异性见解(例如,在肺腺癌中的单细胞分析已确定原发肺肿瘤中一个独特的脑转移相关肿瘤细胞亚群,由S100A9等基因标记,与随后的BrM发展相关),但它们可能会忽略跨疾病的转移机制。比较性、跨肿瘤分析可以揭示单肿瘤研究可能错过的脑转移扩散的普遍驱动因素和生物标志物。事实上,证据表明,肿瘤微环境中的某些BrM相关基因表达变化(例如在基质或免疫区室中)在不考虑癌症起源组织的情况下是保守的。识别此类共同特征可以为广泛适用的诊断工具提供信息。

鉴于上述情况,本研究利用scRNA-seq跨多种癌症类型,识别原发肿瘤中BrM相关标记。我们使用可解释的深度学习框架——Scailyte公司内部平台ScaiVision,从scRNA-seq数据中提取生物学上有意义的特征,同时保持模型透明度。ScaiVision采用监督表示学习来生成低维度但生物学相关的嵌入,以区分BrM细胞与其原发肿瘤对应物。通过基于集成梯度的特征归因分析,我们的模型识别了驱动分类决策的单个基因,从而实现了对其输出的直接生物学解释。这种架构允许跨肿瘤泛化,同时保留对识别转移相关特征至关重要的细胞类型特异性信号。我们进一步利用这些基因创建了一个评分系统,以揭示负责脑趋向性的细胞,并分析了这些细胞的内在作用机制以及与微环境协调的作用机制。由此产生的BrM特征也可在液体活检(特别是肿瘤教育血小板)中检测到,突显其作为早期检测和风险分层的非侵入性生物标志物的潜力。更广泛地说,这种策略展示了如何将可解释的机器学习应用于单细胞数据,以揭示临床上可行的生物标志物和对跨癌症类型转移进展的机制见解,为在其他转移性或治疗抵抗性疾病环境中应用类似方法提供了蓝图。

结果

使用可解释神经网络对脑转移和原发癌症进行建模

尽管诊断技术和治疗干预取得了进展,脑转移(BrMs)仍然与不成比例的高发病率和死亡率相关。这一临床挑战凸显了迫切需要发现稳健的分子生物标志物,以促进易发生脑转移的原发性恶性肿瘤的早期诊断、患者分层和靶向治疗开发。为解决这一未满足的需求,我们设计了一个以阐明脑转移的转录决定因素为核心的计算工作流程,使用单细胞转录组谱。认识到传统深度学习框架通常作为"黑箱"运行,缺乏对特征生物学相关性的可解释性,我们实施了一种专为单细胞分类定制的完全可解释的表示学习架构。该框架不仅使我们能够以高准确性区分BrM样本与其原发肿瘤对应物,还提取了可能定义单细胞水平转移表型的高度判别性基因特征。

我们的方法基于这样一个生物学假设:占据转录相似状态的细胞可能共享功能和发育程序,使我们能够基于基因表达相似性推断单个细胞的转移潜力。利用这一原则,我们旨在识别BrM特异性分子程序,并构建脑转移特征富集评分,以评估其在单个细胞中的存在(图1A)。我们收集了一个包含115名患者样本的单细胞RNA测序(scRNA-seq)数据集,包括21个脑转移和94个原发肿瘤(图1B,补充图1A)。该数据集分为训练队列(n=70;13个BrM,57个原发)和验证队列(n=45;8个BrM,37个原发),以支持稳健的模型开发和独立性能评估。为避免原发和转移性肿瘤之间细胞组成的差异带来的偏差,我们将模型训练限制在上皮细胞(图1C)。先前的研究支持上皮细胞特异性scRNA-seq特征的改进准确性,强调了在生物标志物开发中细胞类型特异性的重要性。

为启动模型训练(图1D),我们首先从基因表达矩阵中选择高变基因(HVGs),在保留与生物信号相关的关键方差的同时降低维度。从这个表示中,随机抽样代表性细胞以确保多样性并避免抽样偏差。随后,数据通过一系列卷积滤波器处理,这些滤波器扫描特征以学习表明BrM或原发来源的局部转录模式。这些滤波器激活通过整流线性单元(ReLU)激活函数传递,引入非线性变换,随后进行Top-K池化,保留最具信息量的特征进行分类,通过广泛的超参数调优优化模型性能。池化特征随后输入到具有SoftMax函数的全连接输出层,产生区分BrM和原发样本的类概率。我们在六个独立的蒙特卡洛交叉验证分割中训练了总共300个深度学习模型,每个模型最多50个训练周期,并保留对应于验证损失最低的周期的模型权重,以防止过拟合。分类准确性和交叉熵对数损失等评估指标在分割中表现出一致的性能和训练稳定性(补充图1B-D),证明了我们学习架构的稳健性和泛化性。

为了进行下游生物学解释,我们选择了表现出高辨别性能的模型,定义为训练集中的受试者工作特征曲线下面积(AUC)>0.9和验证集中的AUC>0.8(图1E)。进一步的评估包括准确性和交叉熵对数损失。这种严格的过滤产生了223个预测模型的最终集成(图1C;补充图1B-D),每个模型都能够可靠地识别与转移潜力相关的转录特征。这些模型的高预测准确性,加上它们的可解释性,为剖析BrM潜在的分子程序奠定了坚实基础。

从上皮细胞中识别出高准确预测BrM的基因特征

为了揭示模型预测背后的分子驱动因素,我们使用Integrated Gradients (IG),通过Captum.ai可解释性库实施,进行了系统的特征归因分析。这种方法通过将预测概率相对于输入特征的梯度积分,实现对每个输入基因对模型输出贡献的原则性估计。我们在高性能深度学习模型集成上应用IG,生成一个基于基因在区分脑转移(BrM)和原发肿瘤细胞中的相关性优先排序的聚合归因矩阵。通过这种聚合,我们根据它们的平均归因分数导出了一个共识基因排名,最终确定了173个高变基因(HVGs),这些基因在模型中具有一致的高解释能力。该列表中前20个最具影响力的基因如图2A所示,而完整的排名基因集在补充表2中提供。我们统称这些基因为BrM特征,代表一组核心转录特征,可能与脑转移进展在机制或功能上相关,因此值得进一步的实验验证和治疗探索。

为评估BrM特征在单个细胞中的生物学相关性和预测效用,我们使用UCell评分框架计算了每个上皮细胞的相对转移潜力评分,涵盖BrM和原发肿瘤来源(图2B)。如预期,源自组织学确认的脑转移的上皮细胞表现出持续高转移潜力评分,验证了我们的特征对已知转移表型的敏感性(图2C)。重要的是,原发肿瘤样本中的上皮细胞子集也获得了高转移潜力评分,表明存在具有潜伏转移能力的转录预处理亚群。这一发现强化了转移潜力可能在原发肿瘤内异质性的观点,并突显了我们的特征前瞻性地识别高风险细胞群体的潜力。此外,BrM特征在多种癌症类型中展示了稳健的预测能力(图2D),进一步支持其跨肿瘤适用性和生物学泛化性。为进一步按转移潜力分层,细胞被分为高评分(前20%)、中评分(20-80%)和低评分(后20%)组。比较高评分和低评分细胞的差异伪批量基因表达分析确定了与高转移潜力相关的显著转录差异(图2E),包括在高转移评分细胞中上调与细胞外基质重塑、细胞外结构组织、突触信号传导和细胞粘附相关的通路(图2E)。这些通路是转移过程的已知贡献者,强调了我们特征的生物学有效性。

为捕捉从原发到转移状态的动态进展,我们分析了来自两名患者的配对原发肺肿瘤和匹配脑转移的scRNA-seq数据,实现了对整个转移连续体上BrM特征的直接评估。经过标准预处理后,使用我们已建立的基因特征计算每个细胞的BrM评分。如预期,脑转移中的评分升高,特别是在上皮细胞中(补充图2A-B)。为绘制转移进展的轨迹,我们使用Monocle2进行伪时间分析。使用DDRTree嵌入细胞,揭示了与BrM评分强相关的伪时间轴,进一步验证了特征捕捉从原发到转移状态的转录进展的能力(图2F)。为确定沿此轨迹动态调控的基因,我们应用GeneSwitches R包,识别出在伪时间过程中激活或抑制的关键基因。ZBTB16、NFIA、NKD1和SOX6等基因被开启,而DOCK2、IGHA1和MUC1被关闭(补充图2C)。这些基因包括可能在转移转换和生态位适应中起作用的转录因子和表面蛋白。

对这些时间调控基因的基因本体分析揭示了包括细胞增殖、粘附、淋巴细胞激活和免疫发育在内的生物过程的富集。值得注意的是,免疫相关通路,如B细胞受体信号传导和吞噬吞噬作用,在伪时间的后期阶段被选择性上调,暗示它们在脑内转移建立的最后阶段的作用(补充图2D)。

VEGF信号传导与BrM评分相关,并区分原发肿瘤和脑转移中的细胞-细胞网络

为扩大我们的分析范围,我们将BrM特征应用于整个单细胞数据集,其中包括各种肿瘤和基质细胞类型。这证实了在已建立的脑转移细胞中具有高BrM评分,但也识别出原发肿瘤中的高评分细胞,支持该特征即使在转移前也有潜力标记有转移风险的细胞。高评分细胞在多种癌症类型中被发现(补充图3A-C),并且跨越包括单核细胞、内皮细胞、神经上皮细胞和中性粒细胞在内的多样化细胞群体。遵循我们已建立的分层(前20%,中间60%,后20%),差异伪批量基因表达分析揭示了高评分细胞中的独特转录程序。这些程序在与转移进展密切相关的细胞外基质重塑、免疫调节、趋化性和细胞粘附等通路中富集(补充图3D)。

认识到BrM特征识别肿瘤和基质区室中转移潜力的能力,我们接下来研究了可能驱动这种表型的细胞-细胞通信网络。肿瘤-基质通信在癌症转移和治疗反应中起着关键作用,特别是在脑的复杂微环境中。使用CellChat识别高评分与低评分细胞之间相互作用的差异数量,我们发现几个信号通路在高评分细胞中显著上调,其中ANGPT最为丰富。VEGF信号传导在高评分细胞中也比在低评分细胞中更为活跃(图3A)。内皮细胞是这种通信中的关键参与者,特别是通过VEGFA-VEGFR1配体-受体轴,已知该轴与各种癌症中的转移进展相关(补充图3E)。为验证这些发现,我们使用LIANA(LIgand-receptor ANAlysis工具),一种汇总多种细胞-细胞相互作用算法的共识工具。LIANA分析证实上皮细胞作为发送者和内皮细胞作为接收者在高评分群体中的主导作用,并再次强调VEGFA-VEGFR1是中心相互作用(图3B-C)。

为确定通信模式是否因肿瘤部位而异,我们分别分析了来自原发肿瘤和BrM样本的高评分细胞。虽然VEGF信号传导在两种背景下都是一致的特征,但交互网络的结构发生了变化。在原发肿瘤中,上皮细胞发挥了更突出的信号传导作用,而在BrM部位中树突状细胞更具影响力(图3B)。这些发现指向了随着转移在脑中建立而发生的VEGF相关通信网络的动态重构。

最后,我们探索了VEGF靶基因在转移进展过程中的转录动力学。使用文献推导的VEGF靶点和UCell评分,我们观察到随着细胞按BrM评分分箱(以10%为增量),VEGF靶基因表达逐渐增加,在最高评分组中达到峰值(图3D)。这一趋势得到了VEGF信号评分和BrM评分之间强相关性的支持(R = 0.7,p < 2.2e-16)(补充图3F)。这些结果强调了VEGF信号传导不仅是标记,而且可能是转移转换的功能驱动因素。综上,我们的发现表明,VEGF介导的肿瘤-基质相互作用,特别是通过VEGFA-VEGFR1,在支持脑中转移细胞的出现和存活中至关重要。

基因调控网络分析确定ETS1为VEGF驱动脑转移的潜在调控因子

VEGF信号传导一直被牵涉在血管生成和转移进展中,我们先前的分析表明它在脑转移中跨越多种肿瘤谱系。为研究支撑这种VEGF驱动BrM表型的调控控制,我们检查了可能在转移进展过程中调控VEGF通路活性的转录调控网络。

我们分析了来自两名具有匹配原发肺肿瘤和脑转移患者的单细胞RNA-seq数据,这些数据先前用于我们的伪时间分析。细胞根据其BrM特征评分分布分为九个等大小的分箱,使我们能够追踪跨越BrM潜力连续体的调控变化。使用CellOracle独立推断每个分箱的基因调控网络(GRNs),从而识别出作为转移进展函数具有差异连接性的转录因子(TFs)。在VEGF通路基因表达也最明显的最高BrM评分组中,MYC、STAT1、MEF2C和特别是ETS1等TFs表现出高度中心性(图4A),表明它们在协调促转移转录程序中的潜在重要性。在这些中,ETS1由于其在调控VEGF介导的血管生成和组织侵袭中的公认作用,成为一个特别引人注目的候选者。通过比较跨分箱的TF连接性,我们观察到ETS1调控影响的逐渐增加,与VEGF通路激活和BrM评分富集平行(图4B)。

我们接下来专注于表征ETS1在更广泛的多癌症数据集中的活性,以评估其在VEGF驱动BrM背景中的相关性。尽管ETS1转录本丰度适中,与scRNA-seq在捕获TFs方面的已知限制一致,但其表达水平随BrM评分升高而增加(图4C)。为更好地量化其调控活性,我们从推断的CellOracle网络中提取ETS1靶基因,并基于这些下游靶基因的表达为每个细胞计算UCell富集评分。这个基于GRN的ETS1活性评分在BrM评分分箱中表现出清晰的上升趋势(图4D),表明ETS1不仅与VEGF驱动的转移潜力相关,而且可能作为支撑该表型的转录程序的功能调控因子。

综上,这些发现将ETS1突显为脑转移中VEGF相关基因网络的潜在转录调控因子。通过将调控网络推断与活性评分和表达谱分析相结合,我们揭示了支撑VEGF驱动BrM表型的分层调控架构。这种方法使我们能够敏感地检测关键转录驱动因子,即使单独表达不足,并强调了基于网络的策略在剖析脑转移调控基础方面的价值。

空间转录组学揭示BrM区域中的VEGF驱动微环境

为扩展我们的转录组见解,我们分析了来自四名被诊断为结直肠脑转移患者的空間转录组学数据。这种方法不仅使我们能够在组织架构内直接验证BrM特征,还能够研究转移潜力如何在肿瘤的不同微解剖区域变化,并改进我们对转移生物学的理解。

我们应用UCell评分将BrM特征活性映射到每个空间转录组学幻灯片的全部区域。值得注意的是,显示高BrM特征评分的细胞不仅限于肿瘤核心;相反,它们延伸到外周肿瘤区域,包括靠近血管和肿瘤相关炎症部位的区域(图5A,补充图4A)。这种空间分布揭示了转移潜力的显著异质性,突显了塑造肿瘤进展的复杂微环境景观。

为进一步剖析支撑这些变化的分子差异,我们进行了差异基因表达分析,比较高评分区域(前20% BrM特征活性)与所有其他肿瘤区域。该分析确定了在线粒体功能、内体运输、囊泡定位和Ras信号传导中富集的通路(图5B)。这些发现突显了可能驱动或维持这些空间不同生态位中转移行为的活跃细胞过程。

鉴于VEGF信号传导在促进脑转移中的公认作用,我们接下来利用CellChat表征细胞间通信的空间模式。VEGF介导的相互作用在所有患者样本中持续突出,特别是在肿瘤细胞和与血管相关的基质区域之间(图5C-D,补充图4B)。值得注意的是,这些VEGF富集区与显示升高BrM特征评分的区域强烈重叠(图5A),加强了VEGF信号传导与增强转移能力之间的联系。为在原位可视化这些动态,我们将VEGF通路活性直接投射到肿瘤部分的空间地图上。这种投影揭示了肿瘤相邻血管生态位和炎症相关区域中VEGF信号传导的显著富集,这些微环境对肿瘤-基质串扰至关重要,可能是转移进展的贡献者(图5D,补充图4C)。

此外,我们检查了关键VEGF信号配体-受体对VEGFA-VEGFR1的空间分布,这是我们先前在泛癌scRNA-seq数据中识别的。空间映射显示VEGFA-VEGFR1相互作用特别富集在高评分转移区域。这种配体-受体相互作用主要定位于与活跃肿瘤生长和炎症相关的区域,表明其在促进转移扩散和转移微环境中肿瘤细胞存活中的可能作用(图5E)。这表明VEGFA-VEGFR1信号传导在支持肿瘤细胞存活、血管生成和脑转移生态位内的扩散中起着关键作用,作为促进转移进展的中心轴。

药物重定位分析确定Pazopanib为靶向VEGF驱动脑转移的潜在治疗候选物

为识别可能逆转与高转移风险相关的转录程序的潜在治疗化合物,特别是那些与VEGF驱动脑转移相关的,我们在集成的多癌症单细胞RNA-seq数据集上应用了ASGARD R包。细胞根据其BrM评分分层,前20%定义为高BrM,后20%定义为低BrM。然后使用limma进行差异基因表达分析,比较高评分与低评分细胞,以识别在转移状态中一致上调或下调的基因。

所得的差异表达基因作为ASGARD药物重定位管道的输入,该管道挖掘广泛的L1000药物反应数据集(包含超过590,000个化合物谱),以识别能够逆转转移基因表达特征的小分子。化合物基于其调节BrM相关基因表达的预测功效进行排名,候选药物通过<0.05的错误发现率(FDR)阈值进行筛选。在包括乳腺癌、结直肠癌、肺癌、鼻咽癌(NPC)、卵巢癌和胰腺导管腺癌(PDAC)在内的多种恶性肿瘤中,鉴定出预测药物评分>0.5和FDR<0.05的有希望的药物候选物(图6A)。

在排名靠前的候选物中包括Pazopanib,一种具有已知转移性癌症临床活性的多激酶抑制剂,也是VEGF受体的公认抑制剂。鉴于我们先前将VEGF信号传导确定为BrM表型的关键驱动因素,我们进一步研究了Pazopanib在数据集中的各种癌症类型中的作用机制。使用ASGARD,我们提取了高BrM评分细胞中预测的Pazopanib响应基因,并将这些靶点映射到细胞类型和信号通路(图6B)。Pazopanib的调控足迹包括上皮肿瘤细胞、内皮区室和基质成纤维细胞中VEGF相关基因表达的调节,表明其具有破坏肿瘤内在和微环境转移驱动因子的潜力。需要进一步的实验验证来评估其在BrM特异性模型中的功效,并探索与现有疗法的潜在协同作用。通过直接靶向VEGF相关转移程序的转录基础,Pazopanib可能作为精确治疗剂,减轻多种肿瘤类型中脑转移的风险或进展。

BrM评分在BrM患者的肿瘤教育血小板中可检测到

鉴于临床上对非侵入性、实时生物标志物监测转移性疾病进展的需求,我们试图确定我们的脑转移(BrM)基因特征是否可以在癌症患者的外周血样本中检测到。液体活检方法,如基于血液的转录组分析,与组织活检相比具有多种优势,包括患者不适最小、适合重复采样以及随时间动态监测疾病活动的潜力。

为此,我们利用了一个公开可用的从代表七种不同癌症类型的患者收集的肿瘤教育血小板(TEPs)衍生的批量RNA测序数据集。该队列包括有和没有转移性疾病的个体,使我们能够比较这两种临床状态之间的转录谱。作为初步步骤,我们专注于血管内皮生长因子(VEGF)信号传导通路,因为它在促进血管生成和转移中的公认作用。分析显示,转移性癌症患者的VEGF通路基因平均mRNA表达显著高于健康对照(p < 0.01)。然而,当比较原发肿瘤患者与脑转移患者时,VEGF基因表达没有显著差异(p = NS)(图7A),表明VEGF虽然在一般转移性疾病中升高,但缺乏区分脑转移与原发肿瘤所需的特异性。

我们接下来评估了我们的20基因BrM特征在相同数据集中的表现。值得注意的是,所有20个BrM基因在脑转移患者的TEPs中相对于健康供体(每个基因p < 0.01)和仅携带原发肿瘤的患者(每个基因p < 0.05)均显著上调(图7B)。重要的是,BrM特征基因在原发肿瘤和健康组之间没有差异表达(所有基因p = NS),强调了该特征对转移性脑受累的特异性。

这些发现证明,与VEGF不同,BrM特征在循环血小板中产生稳健的、转移特异性的转录信号。这种独特的分子谱能够准确区分脑转移和非转移病例,从而将BrM特征定位为临床上相关液体活检环境中转移进展的有希望的血液生物标志物候选物。它们强调了其在癌症患者中早期检测、预后和监测转移性脑疾病的转化潜力,提供了强大的非侵入性工具,用于指导治疗决策和监测。

讨论

脑转移(BrMs)代表了肿瘤学中的一个困难临床挑战。它们是成人中最常见的颅内肿瘤,发生在估计9-17%的所有癌症患者中。值得注意的是,BrMs最常源自肺癌、乳腺癌和黑色素瘤,这三种原发性肿瘤共同占所有BrM病例的约70%。BrM患者的预后很差,早期检测非常困难,因为没有常规的脑转移筛查方案,当前的成像方式敏感性有限。因此,许多BrM在出现症状之前未被诊断,此时治疗选择主要是姑息性的。这种临床现实突显了迫切需要改进策略,以在干预可能显著改善患者结果的阶段预测和检测BrMs。

我们研究的一个核心见解是多癌症分析框架在揭示脑转移(BrM)的共享机制方面的力量,超越了肿瘤特异性限制。先前定义转移相关转录程序的努力主要局限于单个肿瘤类型,限制了它们在恶性肿瘤中的泛化性。相比之下,最近的证据表明,源自不同原发灶的转移性病变可以收敛到共同的基因表达状态。基于这一原则,我们整合了多种肿瘤类型的scRNA-seq数据,以识别超越起源组织的BrM相关基因特征。我们应用ScaiVision的监督表示学习框架训练神经网络,在单细胞分辨率上分类BrM状态。这种方法学习肿瘤不可知的低维表示,最大化BrM和非BrM细胞之间的分离,同时保留生物学粒度。

与传统的基于簇或伪批量分析不同,这种方法避免了平均伪影并实现了可解释的模型。使用集成梯度的特征归因产生了一套稳健的BrM相关基因,按其对分类的贡献排名。重要的是,所得特征在独立队列和计算策略中可重复,支持其泛化性。总体而言,这些发现确立了可以从单细胞数据中推导出稳健的跨癌症BrM转录程序,提供了机制剖析和转化开发的框架。

在我们集成的数据集中对细胞进行评分证实,BrM特征在肿瘤类型和细胞区室中广泛保守。来自不同原发灶的脑转移(肺、乳腺、肾)收敛到共享的转录程序,强调了脑定植所需的共同分子适应集。尽管遗传谱系不同,转移细胞一致上调了与血管生成、细胞外基质(ECM)重塑和细胞间信号传导相关的基因。重要的是,BrM特征基因超出了肿瘤内在表达。许多编码介导肿瘤-微环境通信的分泌配体或受体。配体-受体相互作用分析揭示了恶性细胞和宿主脑细胞之间的稳健串扰,促血管生成信号,特别是通过VEGF通路,成为重复轴。这种交互足迹在转移中是保守的,表明基质参与的通用机制。值得注意的是,VEGF家族成员如VEGFA和PlGF持续上调,暗示VEGF、VEGFR1信号传导在内皮破坏和血脑屏障(BBB)通透性中的作用,与先前研究一致。这些信号已知会触发MMP介导的ECM降解和连接分解,促进肿瘤外渗到脑实质中。我们特征中对血管生成和ECM重塑的富集与已建立的转移机制紧密对齐,强化了其生物学相关性和在识别BrM中泛癌症脆弱性方面的潜在效用。

为进一步验证和情境化BrM特征,我们整合了空间转录组学和外部数据集。脑转移组织的空间谱分析确认关键特征基因表现出与肿瘤-宿主相互作用生态位一致的精确定位模式。如VEGFA等血管生成配体在肿瘤-基质界面富集,而它们的同源受体(例如VEGFR1)由相邻的内皮和免疫细胞表达,提供了对单细胞数据推断的配体-受体串扰的空间证据。这种共定位强调了BrM程序的原位相关性及其在塑造转移生态位中的作用。使用来自匹配原发和脑转移样本的独立scRNAseq数据集进行交叉队列验证,在跨癌症类型的脑病变中显示BrM特征基因的一致上调。特征评分稳健地区分了转移与其原发对应物,确认了特征对转移状态的泛化性和特异性。

为探索BrM特征的临床效用,我们评估了其在外周血中的可检测性。肿瘤教育血小板(TEPs)的转录组分析揭示了BrM特征基因在脑转移患者中的明确表达,但在非转移性对照中没有,支持循环血小板捕获肿瘤衍生信号的观点。虽然VEGF相关转录本持续富集,但它们缺乏足够的特异性。相比之下,更广泛的BrM特征在跨癌症类型的脑转移与原发肿瘤之间可靠地区分,反映了与脑趋向性相关的独特转录程序。这些观察突显了BrM特征作为非侵入性生物标志物的潜力。其在不同肿瘤起源中的表达以及在匹配转移样本中的富集,将其定位为早期检测和风险分层的候选物。特别是,在TEPs中检测特征转录本的能力为基于液体活检的诊断提供了一条可行路径。这种检测可能通过识别放射学检测前的转移来补充成像,并实现血脑屏障后疾病活动的实时监测。鉴于脑转移在肺癌、乳腺癌和黑色素瘤等恶性肿瘤中的频率,基于血小板的测试可能在指导监测和治疗反应方面具有广泛的转化相关性。

在高BrM评分细胞中,MYC和ETS1作为主导转录调控因子出现,突显了它们在驱动脑转移中的潜在作用。这两个因素都是公认的致癌驱动因子,c-Myc协调跨越增殖、代谢重编程、免疫调节和血管生成的程序,这是转移进展中的关键过程。ETS1,作为侵袭和新生血管生成的主调控因子,由于其直接激活基质重塑酶和VEGF信号通路而特别突出。值得注意的是,ETS1活性随着BrM评分的增加而增加,暗示其在逐渐获得转移特征中的作用。升高的ETS1活性表明其在准备转移生态位中的核心作用,特别是通过ECM重塑和血管共用——这对脑定植至关重要的机制。ETS1还与L1CAM的诱导相关,L1CAM是一种神经粘附分子,有助于肿瘤细胞适应脑微环境,进一步强化了其对脑趋向性行为的贡献。

该轴的功能相关性通过我们的药物重定位分析得到强调,该分析将Pazopanib——一种具有脑穿透特性的VEGF受体抑制剂——确定为候选治疗药物。Pazopanib在临床环境中显示出颅内活性,包括在先前治疗抵抗的患者中脑转移的回归。类似药物,如sunitinib,在具有脑转移的肺癌中已证明有效,支持BrM高细胞依赖于血管生成信号进行存活和扩增的前提。这些发现指向抗血管生成策略在遏制脑内转移生长中的可行性。

总之,我们的研究描述了一个支撑脑转移的转录程序,由MYC和ETS1等调控因子锚定,并由稳健的BrM基因特征捕获。这项工作提供了对脑界面转移适应的机制洞察,并提出了诊断和治疗的可行途径。进一步的功能研究和前瞻性验证对于将这些见解转化为早期检测和靶向干预的临床工具至关重要,最终改善面临或患有脑转移风险的患者的预后。

方法

数据获取和处理

利用公开可用的单细胞RNA测序(scRNA-seq)、空间转录组学(ST)和批量RNA测序数据集。主要使用10x Genomics技术生成的scRNA-seq数据从补充表1中详述的来源汇总,包括来自GSE223503的配对原发肺癌症和脑转移(BrM)样本。ST数据从GEO登录号GSE179572获取,批量RNA-seq数据从GSE68086获取。来自公共scRNA-seq来源的原始UMI计数矩阵和相关元数据被汇总。所有数据均可从引用的来源公开获取。

scRNA-seq分析

在R (v4.1.1)中使用Seurat进行分析。如果细胞表达>200个基因且<20%线粒体读数(PercentageFeatureSet,前缀='^MT-'),则保留细胞。使用scDblFinder (v1.6.0,默认参数)识别并移除潜在双胞胎。使用log转换(NormalizeData,method='LogNormalize',scale.factor=10,000)对数据进行归一化。识别前2,000个高变基因(HVGs)(FindVariableFeatures,method='vst')并进行缩放(ScaleData)。在HVGs上执行主成分分析(PCA)(RunPCA),前30个PC用于下游分析,包括K近邻图构建(FindNeighbors)和Louvain聚类(FindClusters,resolution=0.2)。使用均匀流形近似和投影(UMAP)进行可视化(RunUMAP,input=30 PCs)。

细胞类型注释

使用SingleR进行细胞类型注释,参考来自celldex的人类主要细胞图谱。

ScaiVision

在第一步中,ScaiVision通过子采样使用数据增强,增加可用训练样本的数量。这些数据被构造成多细胞输入,基因在水平轴上,细胞在垂直轴上。接下来,ScaiVision随机初始化滤波器权重,并通过点积计算每个细胞-滤波器对的响应值。这些滤波器作为连接基因表达值与结果预测(原发或BrM)的连接,实现自动特征选择,无需提前细胞聚类,确保方法保持无偏见且对细胞类型和特征不可知。在第三步中,ScaiVision通过top-k池化聚合细胞响应以进行全样本预测,这是一种灵活的方法,计算定义的前百分比细胞上的平均值,允许敏感检测BrM或原发细胞。随后,滤波器值通过矩阵乘法在输出层中组合,为每个输出类生成概率。

最后,在网络训练中,网络使用损失函数跨多个周期进行训练,该损失函数比较预测和实际标签,通过反向传播和参数更新减少每个批次的损失,直到达到指定的结束条件,产生在预测BrM或原发方面具有高准确性的训练网络。

基因集分析

使用Captum框架内的集成梯度计算特征重要性分数,定义"BrM特征"。该特征以及其它基因集使用UCell按细胞评分,该方法使用基于秩的Mann-Whitney U统计量。对于某些分析,细胞根据其在BrM样本中的相对转移评分进行分类:'高评分'(前20%)和'低评分'(后20%)。此外,评分被分为十分位数(10%间隔)以进行评分分布的可视化和分析。

轨迹和基因开关分析

在配对原发肺和BrM scRNA-seq数据(GSE223503)上使用Monocle 2进行伪时间轨迹分析,以模拟转移进展。创建CellDataSet对象(expressionFamily=negbinomial.size())。特征选择使用Seurat中识别的HVGs。使用DDRTree(reduceDimension,max_components=10)降低维度,并使用orderCells将细胞按伪时间排序,将原发肺肿瘤细胞定义为根状态。使用GeneSwitches进行分支依赖基因表达分析,识别与高BrM分支显著相关的基因。

空间转录组学分析

使用10X Genomics的Visium平台生成的ST数据(GSE179572)使用Seurat进行处理。使用SCTransform对数据进行归一化。使用FindMarkers(Wilcoxon检验,Benjamini-Hochberg FDR < 0.05)评估预注释区域之间的空间差异表达。使用UCell将转移评分特征映射到ST点上。

细胞-细胞相互作用分析

使用CellChat18与CellChatDB.human数据库从归一化的scRNA-seq数据中推断潜在的配体-受体相互作用。细胞根据细胞类型注释和转移潜力评分分组(在BrM样本中前20%定义为'高',后20%定义为'低')。使用默认参数执行CellChat分析,以识别显著的配体-受体对和通信通路。比较高评分和低评分转移细胞与其他细胞类型(例如,基质、免疫)相互作用的相互作用模式,包括相互作用的数量和强度,以识别可能驱动转移的差异通信网络。使用netVisual_circle和其它相关功能进行可视化。

基因调控网络(GRN)分析

使用CellOracle26按照标准文档推断GRNs(

批量RNA-seq分析

批量RNA-seq读数(GSE68086)使用STAR对齐到hg38。使用featureCounts量化基因水平计数。使用DESeq2进行归一化(Wald检验,Benjamini-Hochberg FDR < 0.05)。

药物重定位筛选

使用ASGARD30与默认参数进行in silico药物重定位。按转移评分分组的归一化scRNA-seq计数(低评分=对照)作为输入,与LINCS L1000药物扰动数据库进行比较。计算药物评分,识别在相关比较中具有显著评分的候选药物。

统计分析

在R (v4.3.1)中进行分析。使用Wilcoxon秩和检验进行组间比较。使用Benjamini-Hochberg方法调整多次检验的p值(FDR < 0.05)。对于其它检验,p值<0.05被认为具有显著性。

数据可用性

本研究使用的所有数据集均可公开获取。

补充图表

补充图1. 上皮细胞中的模型训练和BrM特征性能。

(C) 所有折叠中训练和验证样本的ROC曲线下面积,表示模型在训练和验证数据上的性能。每个点代表具有自己超参数集的单独模型。 (D) 在分类阈值为0.5时,所有折叠中训练和验证样本的模型准确率。每个点代表具有自己超参数集的单独模型。 (E) 所有折叠中验证样本的交叉熵对数损失。每个点代表具有自己超参数集的单独模型。 (F) 比较高评分和低评分细胞之间上皮细胞的BrM特征评分(UCell)的提琴图。

补充图2. 扩展BrM特征和基于伪时间的富集分析。

(A) 来自配对原发肺和BrM样本的scRNA-seq数据的UMAP图,按终点标签、原始患者ID和BrM特征评分(UCell)着色。 (B) 突出BrM样本中更高BrM评分的提琴图 (C) GeneSwitches图,识别在伪时间轨迹中显著激活('开',正R2)或失活('关',负R2)的基因。标记关键基因。颜色表示基因类型的注释 (D) 对在伪时间过程中动态调控的基因进行基因本体(GO)富集分析结果。

补充图3. 扩展细胞-细胞通信分析。

(A) UMAP图,将BrM特征评分(UCell)投影到多种癌症类型的全部细胞上。颜色刻度表示BrM评分。 (B) 比较高评分(前20%)与低评分(后20%)细胞之间生物过程的基因本体(GO)富集分析结果,基于所有细胞类型中差异伪批量基因表达分析。点大小长度表示基因计数;颜色表示显著性水平。 (C) 比较多癌症完整scRNA-seq数据集中按癌症类型和终点标签的BrM特征评分(UCell)的提琴图。 (D) 比较多癌症完整scRNA-seq数据集中按细胞类型的BrM特征评分(UCell)的提琴图。 (E) 在低评分和高评分细胞之间共识细胞类型和共识细胞类型中配体相互作用的CellChat VEGF网络可视化 (F) 散点图,说明细胞水平BrM特征评分(UCell)与VEGF靶基因集评分(UCell)之间的相关性。相关系数(R)和p值已标示。

补充图4. 额外的空间转录组学结果。

(A) 空间特征图,将BrM特征评分(UCell)映射到结直肠癌BrM患者的额外组织切片或区域上。 (B) 额外的CellChat网络热图,总结推断的VEGF信号传导与注释组织区域之间的相互作用。 (C) 额外的CellChat空间相互作用图,详细说明特定样本中注释组织区域之间的VEGF信号传导相互作用。

附加信息

作者贡献

R. L.和V.K.T.设计了研究,分析了数据并撰写了手稿。D.C.提供了对手稿的关键编辑。S.C.共同监督分析并撰写了手稿。

资助

本研究由经济部(DfE)、BBSRC大学研究创新商业化(ICURe)(项目参考:Mid-H-13)、Novo Nordisk Foundation 3110103、丹麦国家研究基金会DNRF177和丹麦癌症学会R374-A22449向VKT提供的资助支持。

【全文结束】

猜你喜欢
  • 西德拉医学研究被认定为癌症微生物组领域关键进展西德拉医学研究被认定为癌症微生物组领域关键进展
  • 日本树蛙体内发现强效抗癌药物日本树蛙体内发现强效抗癌药物
  • PsiThera公布新任CEO任命及4750万美元A轮融资 推进针对经验证的免疫与炎症靶点的口服药物研发PsiThera公布新任CEO任命及4750万美元A轮融资 推进针对经验证的免疫与炎症靶点的口服药物研发
  • 微生物组在精准医疗中的应用微生物组在精准医疗中的应用
  • 研究测量支持小组中的行为标志物及机器学习在心理健康领域的可行性研究测量支持小组中的行为标志物及机器学习在心理健康领域的可行性
  • 研究人员开发模型通过血液生物标志物帮助更早诊断ALS研究人员开发模型通过血液生物标志物帮助更早诊断ALS
  • 人工智能辅助液体活检在早期癌症检测中展现广阔前景人工智能辅助液体活检在早期癌症检测中展现广阔前景
  • 早期和晚期脑血管生物标志物截断点的操作化及时间进展早期和晚期脑血管生物标志物截断点的操作化及时间进展
  • 人工智能如何助力疾病检测与加速医疗突破人工智能如何助力疾病检测与加速医疗突破
  • 短暂性脑缺血发作:识别预警信号,挽救生命短暂性脑缺血发作:识别预警信号,挽救生命
热点资讯
全站热点
全站热文