冠状动脉疾病(CAD)一直是全球发病率和死亡率的主要原因,而现有诊断方法往往只能在疾病晚期阶段检测到该病。血浆细胞因子作为炎症的主要介导因素,在非侵入性早期诊断方面具有潜力,但由于其维度极高且类别不平衡,显著增加了分析难度。本文假设可以使用混合深度学习架构,将带梯度惩罚的Wasserstein生成对抗网络(WGAN-GP)与基于Transformer的预测器相结合,前者用于增强合成数据,后者用于基于血浆细胞因子样本预测CAD。研究分析了1,040名患者(390名CAD患者和650名对照组)的样本,采用45重ELISA检测法,从中选取了36种生物学相关的细胞因子。为确保方法学的严谨性,预处理、特征选择和合成数据生成步骤均在交叉验证折叠中进行,以避免数据泄露。该框架的分析采用分层10折交叉验证和独立的外部验证队列进行。该模型达到了平均准确率0.93±0.02(95%置信区间:0.91-0.95),精确度0.88±0.02,召回率0.99±0.01,F1分数0.93±0.01,以及AUC-ROC值0.98±0.01。外部验证结果显示准确率为97%,AUC-ROC值为0.996。Jensen-Shannon散度支持了合成数据分析,重点关注MAE、RMSE以及实际细胞因子分布与生成分布之间的高保真度。与基线模型(如逻辑回归和传统机器学习方法)相比,这种比较分析取得了显著改进。决策曲线分析显示其更具临床实用性,意味着在阈值概率下提供了更好的净收益。然而,该研究也存在一些局限性,如队列多样性不足、缺乏大规模共病人群(例如糖尿病患者),以及仅使用细胞因子特征而未纳入临床变量。本研究表明,所提出的GAN-Transformer模型是一种强大、可解释且具有临床意义的工具,可用于通过非侵入性生物标志物进行早期CAD检测。
【全文结束】

