AI衍生的放射学表型在加入急性中风入院的结构化电子健康记录数据后,有效改善了中风死亡率预测。
研究人员的目标
急性中风的临床预测通常依赖结构化变量,但放射科报告中包含高价值描述性信息,难以大规模量化。本研究评估了从影像输出和放射学文本中实现自动化中风表型分析的可行性,并验证文本衍生的放射学特征能否提升电子健康记录结构化数据之外的死亡率预测能力。
为建立量化基准,研究人员首先分析了60例公开数据集的MRI病灶掩膜。通过自动化处理计算病灶体积和影像特征,构建可复现的病灶量化参考标准。同时,团队处理了大型重症监护数据库中的15,492份头部CT和MRI报告,应用基于规则的自然语言处理流程识别八种中风表型,包括出血、梗塞、中线移位、脑水肿、慢性改变,以及前 cerebral artery(ACA)、中 cerebral artery(MCA)和后 cerebral artery(PCA)区域的血管分布受累情况。
自然语言处理表型提升中风死亡率预测
在报告分类环节,团队使用TF-IDF特征训练逻辑回归模型,并通过曲线下面积(AUC)和F1分数评估性能。最优文本分类器对出血和脑水肿等关键发现实现高判别力,证实从常规放射科语言中大规模提取可解释性中风表型的实用性。
随后,研究人员将概率性自然语言处理表型输出与年龄、性别、ICD-9编码和住院时长等结构化入院变量结合,对3,999例中风入院患者的院内死亡率建模。相比仅使用结构化数据,加入文本衍生表型使模型判别能力获得小幅提升。置换分析显示,ICD-9编码对死亡率预测贡献最大,而脑水肿和梗塞表型则是最具信息量的影像衍生信号。
实践意义展望
作者强调,由于数据集限制,当前模型未纳入MRI病灶体积,未来研究若能结合直接影像指标与文本衍生表型,或可进一步释放潜力。在模型支持临床决策前,还需开展更广泛验证、整合多模态数据,并实现工作流适配的实施策略。
参考文献:Alotaibi A 等人. 人工智能驱动的影像与放射学语言整合提升中风死亡率预测. 前沿神经病学杂志. 2026;16:1722965.
【全文结束】

