数据集背景
这是一个多元数值数据分析集,包含14个属性:年龄、性别、胸痛类型、静息血压、血清胆固醇、空腹血糖、静息心电图结果、最大心率、运动诱发心绞痛、ST段压低、ST段斜率、主要血管数量和地中海贫血类型。虽然该数据库包含76个属性,但所有已发表研究都使用其中14个子集。克利夫兰数据库是机器学习研究者至今唯一使用的数据源。主要研究任务是根据患者属性预测是否患有心脏病,以及通过诊断发现新的临床洞察。
列属性描述
id(每个患者的唯一ID)age(患者年龄)origin(研究地点)sex(男/女)cp胸痛类型(典型心绞痛、非典型心绞痛、非心绞痛、无症状)trestbps静息血压(入院时毫米汞柱数值)chol血清胆固醇(mg/dl单位)fbs是否空腹血糖>120 mg/dlrestecg静息心电图结果
- 值域:正常、ST异常、左心室肥厚
thalach最大心率exang运动诱发心绞痛(真/假)oldpeakST段压低(相对静息状态)slope峰值运动ST段斜率ca荧光透视显影主要血管数(0-3)thal(正常/固定缺陷/可逆缺陷)num预测属性
研究贡献者
- 匈牙利布达佩斯心脏病研究所:Andras Janosi医学博士
- 瑞士苏黎世大学医院:William Steinbrunn医学博士
- 瑞士巴塞尔大学医院:Matthias Pfisterer医学博士
- 美国退伍军人事务医疗中心:Robert Detrano医学博士
重要文献
- Detrano等人在1989年《美国心脏病学杂志》第64卷304-310页发表的国际冠状动脉疾病概率算法研究
- David W. Aha关于克利夫兰数据库预测心脏病的实例研究
- Gennari等人在《人工智能》期刊第40卷11-61页的增量概念形成模型研究
【全文结束】

