我饶有兴趣地阅读了一篇于11月27日在《新英格兰医学杂志》(NEJM)的补充期刊《NEJM AI》上在线发表的文章。这篇文章题为“FDA授权的败血症预测AI/ML工具:开发与验证”,由52位研究人员共同撰写,其中前五位作者分别是Akhil Bhargava、Carlos López-Espina、Lee Schmalz和Shah Khan。
这52位研究人员描述了一项涉及五个主要医疗中心的观察性临床研究,旨在评估首个获得美国食品药品监督管理局(FDA)批准的全面AI工具在预测住院患者早期出现败血症方面的有效性。文章作者写道:“败血症免疫评分在识别和预测败血症及重症指标方面表现出高准确性,能够及时识别高风险败血症和不良结局的患者,从而潜在地改善临床决策和患者预后。”他们还指出,该研究部分资金来自国防威胁减少局。
文章作者写道:“为了满足医院环境中诊断和风险评估工具的需求,我们开发了败血症免疫评分,旨在与电子病历(EMR)集成,利用机器学习(ML)来识别可能在患者评估后的24小时内发展为败血症的患者。该工具于2024年4月获得了美国食品药品监督管理局(FDA)的营销授权(de novo途径),成为首个获授权用于败血症的人工智能(AI)诊断工具。”
此外,他们写道:“本研究的目的是评估败血症免疫评分的性能及其在24小时内风险分层患者是否存在或发展为败血症(按Sepsis-3定义)的能力,以及住院死亡率、住院时间、重症监护室(ICU)入住、机械通气和升压药物使用等次要终点。”
文章中提到,研究纳入标准包括18岁及以上的住院成人患者,这些患者有疑似感染(通过临床决定进行血液培养来定义),并且在首次血液培养订单下达后的6小时内采集了锂肝素(Li-Hep)血浆样本。没有排除标准。参与者被分配到三个队列之一:一个衍生队列(n=2366),用于算法开发;一个内部验证队列(n=393),用于评估同一医院的第二组参与者的算法性能;一个最终外部验证队列(n=698),来自未参与算法开发的医院的参与者。
重要的是,他们写道:“主要终点是在入院时或研究纳入后24小时内根据Sepsis-3标准存在败血症:疑似感染和从基线开始的序贯器官功能障碍评估(SOFA)评分为2或更高。衍生队列使用从病历中自动提取的Sepsis-3结果,而内部和外部验证队列则由临床专家进行回顾性判定,以应用定义并确定Sepsis-3结果。临床判定由可能未治疗患者的临床医生进行,但可以访问整个住院病历,包括实验室测试、放射学测试和临床评估及决策记录。次要终点包括与重症相关的败血症指标:住院死亡率、住院时间、ICU入住、机械通气和升压药物使用。”
文章作者指出:“败血症免疫评分算法分析多达22个输入参数,生成风险评分,并将患者归类为四个不同的风险分层类别。这些参数包括人口统计学数据、生命体征测量、综合代谢面板测量、全血细胞计数面板测量、乳酸水平以及败血症生物标志物PCT和CRP(降钙素原和C反应蛋白是用于检测全身炎症的生物标志物;PCT通常被认为对细菌感染更具特异性,常用于监测败血症)。干预SHAP值表明,模型中最具影响力的三个参数是PCT、呼吸频率和收缩压。在衍生集中的曲线下面积(AUC)为0.85(95%置信区间:0.83至0.87),用于病历衍生的败血症结果。此外,在衍生集中,败血症免疫评分风险类别与败血症风险增加相关。”
他们指出:“败血症免疫评分在预测败血症方面表现出整体较高的诊断准确性,在衍生集中的AUC为0.85(95%置信区间:0.83至0.87),用于病历衍生的败血症结果;在内部验证中为0.80(0.74至0.86),在外部验证中为0.81(0.77至0.86),用于判定的败血症结果。”
研究人员写道:“败血症免疫评分是一个全面的多维AI/ML工具,结合了人口统计学数据、生命体征、临床实验室测试和败血症相关实验室测试,以评估败血症风险和不良结局风险。在这项研究中,我们开发了败血症免疫评分,并评估了其作为疑似感染患者的风险分层工具的能力,以及预测败血症诊断和不良临床结局的能力。我们发现败血症免疫评分在预测败血症和住院死亡率、住院时间、ICU入住、机械通气和升压药物使用等次要结局方面高度有效。我们还发现败血症免疫评分在诊断(预测患者在初始评估时是否有败血症)和预后(预测患者在初始评估时没有败血症但在24小时内是否会发展为败血症)方法中均具有预测能力。”他们承认:“目前已有几款经FDA批准的感染诊断工具,但它们通常仅限于检测一种或多种血液生物标志物。”
研究人员强调,这项研究是“观察性的”,“并未评估败血症免疫评分对临床决策的影响或治疗方案的变化。因此,现在还处于早期阶段。但我非常期待听取在这个领域工作的临床领导者对这项研究的看法,以及这项研究是否预示着使用一种将在全国范围内适用于不同医院组织的工具在早期败血症检测方面取得重大突破。至少,这篇文章表明,AI在患者护理领域的应用正在以比许多人预期更快的速度推进。”
(全文结束)

