最近发表在《eClinicalMedicine》上的一项研究评估了人工智能(AI)算法在非侵入性预测胚胎整倍性方面的有效性。通过分析胚胎图像,AI有望在不进行侵入性检测的情况下预测胚胎的染色体状况,从而为辅助生殖技术提供支持。
胚胎非整倍性如何检测?
胚胎非整倍性是指染色体数量异常,这是导致植入失败、妊娠丢失和先天性异常的主要原因之一。在体外受精(IVF)中,早期胚胎的非整倍性率在25%到40%之间,其发生率随着母亲年龄的增长而增加。虽然基于活检的植入前遗传学检测(PGT-A)可以确定胚胎的整倍性,从而改善IVF结果,但这种方法成本高、侵入性强,并受到伦理和法律限制,因此其应用范围有限。
通过机器学习和深度学习模型,AI已经显示出在准确预测胚胎整倍性方面的潜力。然而,仍需进一步研究以提高这些方法的预测可靠性和临床适用性。
研究概况
本研究在国际系统评价前瞻性注册中心(PROSPERO)注册,并遵循系统评价和meta分析报告指南(PRISMA)和预测模型研究系统评价的关键评估和数据提取指南(CHARMS)。研究人员在Publisher Medline(PubMed)、Medical Literature Analysis and Retrieval System Online(MEDLINE)、Excerpta Medica Database(Embase)、Institute of Electrical and Electronics Engineers(IEEE)、SCOPUS、Web of Science和Cochrane Central Register数据库中进行了全面的文献搜索。搜索内容包括开发用于评估人类胚胎整倍性的AI算法的研究。搜索策略包括AI、基因检测和染色体异常等关键词。截至2024年8月10日发表的研究,如果报告了诊断结果如敏感性、特异性和预测值或包含相关2x2列联表数据,则符合条件。
两名独立评审员筛选了文章,如有分歧则咨询第三名评审员。排除了未使用AI模型、使用非人类样本、重复发表和各种出版类型的文献,如社论。两名评审员使用标准化表格系统地提取数据,以确保准确性。当可用时,从列联表计算诊断指标如敏感性和特异性。
使用质量评估诊断准确性研究的人工智能标准(QUADAS-AI)进行质量评估,并评估潜在偏倚和适用性,任何差异由第三名评审员解决。主要结局指标包括敏感性(Se)、特异性(Sp)和曲线下面积(AUC),通过分层汇总受试者操作特征曲线和双变量随机效应模型进行分析。通过元回归探索异质性,评估因素包括算法类型和地理位置。Deekas漏斗图评估了发表偏倚,而亚组分析则识别了额外的异质性来源,如AI模型类型、注释方法和偏倚风险。
研究发现
初步搜索得到4,774条记录,其中1,543条重复记录被删除。通过筛选标题和摘要排除了2,837项研究,剩下65项研究进行全文审查。最终,20项研究符合纳入标准,其中12项提供了足够的数据用于meta分析。这16项研究中有16项是回顾性的,2项是前瞻性双盲AI模型评估,2项未指定研究设计。没有研究使用开放访问图像,8项研究排除了低质量图像,12项研究未涉及这一因素。7项研究进行了外部验证,使用非样本数据集。10项研究使用了深度学习(DL),5项使用了机器学习(ML),5项同时使用了这两种方法。
AI驱动的决策支持系统(DSS)被分为黑箱、灰箱和透明箱三类,分别有4项、5项和5项研究。4项研究使用了黑箱或灰箱模型,2项研究使用了灰箱或透明箱模型。AI算法的汇总诊断性能显示,敏感性为0.67,特异性为0.58,AUC为0.67。选择各研究中最高准确性的列联表后,敏感性和特异性分别提高到0.71和0.75,AUC提高到0.80。通过Fagan标尺进行临床效用分析,假设整倍体胚胎的患病率为46%,阳性预测值为71%,阴性预测值为75%。
使用QUADAS-AI工具评估研究质量,结果显示19项研究在患者选择方面存在高或不确定的偏倚风险,主要是由于缺乏开源数据和严格的外部验证。异质性分析显示显著变异性,敏感性的不一致性指数(I²)为97.7%,特异性的不一致性指数为92.2%。阈值效应是造成这种异质性的原因之一,即整倍体胚胎的诊断截止值存在差异。
元回归分析确定了影响异质性的因素,包括AI算法类型、DSS类别、注释方法、外部验证、偏倚风险、母亲年龄、样本量和出版年份。敏感性和特异性呈负相关,这在诊断准确性研究中经常观察到。Deekas漏斗图未显示发表偏倚的证据。亚组分析表明,DL模型的AUC高于ML模型,分别为0.71和0.63。结合图像和临床数据的研究表现更佳,AUC为0.71,而仅使用图像数据的研究AUC为0.62。外部验证、较低的偏倚风险、纳入母亲年龄和较大的样本量对模型结果有积极影响。较新的研究也显示出更高的特异性和AUC,从而证明了AI模型准确性随时间的提高。
结论
尽管PGT-A广泛用于通过检测染色体异常来改善妊娠结果,但其侵入性增加了某些并发症的风险,如子痫前期和前置胎盘,对妊娠或活产率的益处有限。因此,开发可靠且非侵入性的整倍性预测方法至关重要。
AI已经在多个临床领域得到应用,具有支持辅助生殖中胚胎评估的潜力。然而,现有的AI模型在整倍性预测方面尚未达到取代PGT-A所需的准确性,应作为胚胎选择的支持工具。
参考文献:
Xin, X., Wu, S., Xu, H., et al. (2024). Non-invasive prediction of human embryonic ploidy using artificial intelligence: a systematic review and meta-analysis. eClinicalMedicine. doi:10.1016/j.eclinm.2024.102897
(全文结束)

