通过预测建模微调CatBoost机器学习方法实现心血管疾病的早期检测Fine tuned CatBoost machine learning approach for early detection of cardiovascular disease through predictive modeling | Scientific Reports

环球医讯 / 心脑血管来源:www.nature.com沙特阿拉伯 - 英语2025-09-05 17:59:46 - 阅读时长3分钟 - 1104字
本研究提出基于CatBoost算法的机器学习模型用于心血管疾病早期检测,通过特征选择、严格验证和数据增强优化,使用医院记录数据达到99%的F1分数和99.02%准确率,显著优于现有方法。模型采用80/20训练测试分割,结合粗糙集理论进行特征选择,实验在16GB内存的联想系统上完成,为临床决策提供高效诊断工具。
心血管疾病早期检测CatBoost算法机器学习特征选择医疗数据诊断准确性健康无症状胸痛运动性心绞痛
通过预测建模微调CatBoost机器学习方法实现心血管疾病的早期检测

心血管疾病(CVD)仍是全球致死致残的首要原因之一,亟需早期诊断以改善临床结果。本研究提出基于CatBoost算法的高级预测模型,利用医院记录作为主要数据源对心血管疾病各阶段进行分类。该模型结合特征选择、严格验证流程和数据增强技术,成功解决了高维医疗数据带来的挑战。在多种机器学习算法中,经过调优的CatBoost模型表现出最高性能,自动化特征选择并实现早期心脏病检测,达到99%的F1分数和99.02%的整体准确率。

研究背景

心血管疾病包含影响心脏和血管的一组疾病,主要由动脉粥样硬化引发。这些疾病通常进展隐匿,早期症状不明显,使得早期检测成为有效干预的关键。研究显示,通过识别和利用现有预测模型的最佳参数设置,诊断准确性得到显著提升。本研究的核心创新在于通过及时精准的预测,为医疗决策提供重要支持。

方法学

研究采用三阶段模型:预处理、训练和分类。预处理阶段将分类变量转换为数值变量,选择重要值大于0.1的特征,通过非参数树方法解决共线性问题。训练过程采用80:20数据划分,使用K折交叉验证提升泛化能力。测试的机器学习算法包括Extra Tree、随机森林、Ada Boost、梯度提升和CatBoost。

数据分析

数据集包含918个病例的12个关键预测变量,其中508例确诊心血管疾病,410例健康对照。男性占比90.2%(410/458),女性占比9.8%(50/410)。特征分析显示,无症状胸痛(ASY)类别占比77.2%,运动性心绞痛与心血管疾病显著相关(85%患者确诊)。

创新贡献

  1. 模型开发:采用80/20划分的高效机器学习模型
  2. 特征选择:通过粗糙集理论优化特征集
  3. 早期检测:实现隐性症状阶段筛查
  4. 数据利用:基于综合心血管疾病数据集训练
  5. 临床应用:提供定量与定性结合的决策支持

实验结果

在联想i5-10210U处理器(1.60GHz)和16GB内存环境中,CatBoost模型表现最优:准确率99.02%、精确度99.04%、召回率99.2%、F1分数0.992。ROC曲线分析显示梯度提升和CatBoost的AUC均达0.95,显著优于随机森林(0.94)和AdaBoost(0.90)。

讨论与展望

尽管机器学习在医疗领域面临数据孤岛等挑战,本研究通过优化超参数和特征选择,将诊断准确性提升至新高度。未来研究将重点验证模型在异质人群中的适用性,扩展可调节风险因素,并引入ANOVA等统计测试评估模型效能。研究团队来自巴基斯坦Sialkot政府女子大学和沙特努拉·宾特·阿卜杜勒拉赫曼大学,已获该校"纳菲亚"计划(NP-45-090)资助。

【全文结束】

大健康

猜你喜欢

  • 在记忆护理荒漠中架起桥梁在记忆护理荒漠中架起桥梁
  • CAPE FOR A CURE:为阿尔茨海默病协会筹款CAPE FOR A CURE:为阿尔茨海默病协会筹款
  • 制药行业拥抱未来实验室——人工智能与自动化如何重塑研发制药行业拥抱未来实验室——人工智能与自动化如何重塑研发
  • 新型ALS血液检测技术可在症状出现前数年发现早期征兆新型ALS血液检测技术可在症状出现前数年发现早期征兆
  • AI听诊器15秒精准检测三大致命心脏疾病 准确率超医生AI听诊器15秒精准检测三大致命心脏疾病 准确率超医生
  • 利用人工智能革新抗生素发现利用人工智能革新抗生素发现
  • 心律失常监测设备市场:规模、增长趋势与2035年预测心律失常监测设备市场:规模、增长趋势与2035年预测
  • 医生开发AI听诊器 15秒可检测三种心脏疾病医生开发AI听诊器 15秒可检测三种心脏疾病
  • 西弗吉尼亚大学研究人员训练人工智能通过低技术心电图诊断农村地区心力衰竭患者西弗吉尼亚大学研究人员训练人工智能通过低技术心电图诊断农村地区心力衰竭患者
  • 探索肾脏疾病指数与认知功能障碍的潜在关系:基于NHANES数据的机器学习方法探索肾脏疾病指数与认知功能障碍的潜在关系:基于NHANES数据的机器学习方法
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康