循证实践：研究设计与证据级别 - 健康研究

循证实践：研究设计与证据级别Study Designs & Evidence Levels - Evidence Based Practice - LibGuides at Medical College of Wisconsin Libraries

环球医讯 / 健康研究来源：mcw.libguides.com美国 - 英语2026-01-07 07:40:09 - 阅读时长6分钟 - 2766字

本文系统阐释了循证医学中的核心研究方法论框架，详细解析了约翰霍普金斯护理循证实践模型的五级证据分类体系，包括实验性研究、类实验性研究和非实验性研究的质量评估标准；通过三步识别法阐明如何区分随机对照试验、队列研究、病例对照研究等方法类型，并明确定义了系统评价、荟萃分析、横断面研究等关键概念；同时深入解读置信区间与p值的统计学原理及其在临床决策中的应用价值，为医疗工作者提供科学评估文献质量的标准化工具，助力基于高质量证据的诊疗实践优化，全文涵盖从研究设计分类到统计推断的完整知识链条，具有显著的临床指导意义。

引言

本部分回顾部分研究定义并提供常用证据表格。

约翰霍普金斯护理循证实践证据级别

证据级别 | 质量指南

一级

实验性研究，随机对照试验（RCT）

随机对照试验的系统评价，含或不含荟萃分析

A 高质量：结果一致且可推广；样本量充足；控制充分；结论明确；基于全面文献综述的统一推荐，充分引用科学证据

二级

类实验性研究

随机对照试验与类实验性研究组合的系统评价，或仅类实验性研究的系统评价（含或不含荟萃分析）

B 良好质量：结果较一致；样本量充足；部分控制，结论较明确；基于较全面文献综述的合理推荐，部分引用科学证据

三级

非实验性研究

随机对照试验、类实验性研究与非实验性研究组合的系统评价，或仅非实验性研究的系统评价（含或不含荟萃分析）

定性研究或系统评价（含或不含荟萃综合）

C 低质量或重大缺陷：证据薄弱且结果矛盾；样本量不足；无法得出结论

证据级别 | 质量指南

四级

基于科学证据的权威专家意见或全国公认专家委员会/共识小组意见

包括：

临床实践指南

共识小组

A 高质量：由专业或政府机构正式赞助；文献检索策略系统化；结果一致且研究设计优良；对纳入研究的科学强度评估严谨；结论明确；具全国专家共识；近5年修订

B 良好质量：由专业机构赞助；文献检索较全面；结果较一致；对研究优缺点有评估；结论较明确；近5年修订

C 低质量或重大缺陷：非官方机构赞助；文献检索策略不明确；无研究评估；证据不足且结果矛盾；超5年未修订

证据级别 | 组织经验

五级

基于经验性非研究证据

包括：

文献综述

质量改进、项目或财务评估

病例报告

基于经验性证据的全国专家意见

A 高质量：目标明确；多场景结果一致；采用正式评估方法；结论明确；推荐与科学证据充分关联

B 良好质量：目标明确；单场景结果一致；采用正式评估方法；推荐较合理

C 低质量或重大缺陷：目标不明确；结果矛盾；评估方法不完善；无法形成推荐

文献综述、专家意见、病例报告、社区标准、临床经验、患者偏好：

A 高质量：专家资质清晰；结论明确；提供科学依据；领域思想领袖

B 良好质量：专家资质可信；结论较明确；论证逻辑合理

C 低质量或重大缺陷：专家资质不明；无法得出结论

（改编自Dang, D. & Dearholt, S. (2017). 约翰霍普金斯护理循证实践：模型与指南. 第3版. 印第安纳波利斯: Sigma Theta Tau International）

研究设计识别方法

通常通过三个关键问题确定研究类型：

Q1. 研究目的是什么？

仅描述人群（PO问题）= 描述性研究
量化因素间关系（PICO问题）= 分析性研究

Q2. 若为分析性研究，干预措施是否随机分配？

是 = 随机对照试验
否 = 观察性研究

对观察性研究，主要类型取决于结局测量时机，因此第三个问题是：

Q3. 结局何时确定？

暴露或干预后 = 队列研究（"前瞻性研究"）
暴露或干预同时 = 横断面研究或调查
暴露确定前 = 病例对照研究（基于暴露回忆的"回顾性研究"）

（资料来源：循证医学中心）

研究类型定义

病例报告/系列： 针对特定结局的系列患者报告，无对照组。

病例对照研究： 识别具有目标结局的患者（病例）与无此结局的患者（对照），回溯其是否接触目标暴露因素。

队列研究： 识别两组患者（队列），一组接受目标暴露，另一组未接受，追踪其目标结局。

随机对照临床试验： 受试者随机分配至实验组或对照组，追踪目标变量/结局。

系统评价： 采用明确方法全面检索文献并批判性评估单个研究，用统计技术整合有效研究的医学文献综述。

荟萃分析： 采用定量方法合成并总结结果的系统评价。

荟萃综合： 对质性研究数据进行系统化分析的方法。（EJ Erwin, MJ Brotherson, JA Summers. 理解质性荟萃综合. 早期儿童干预研究问题与机遇, 33(3) 186-200.）

横断面研究： 在单一时点或时间段对特定人群进行观察，同时确定暴露与结局。

与金标准的前瞻性盲法比较： 评估诊断试验有效性的研究，同时对所有患者实施待验证诊断试验与"金标准"试验，通过比较新试验与金标准的敏感性和特异性确定其潜在效用。

质性研究： 回答与人类对实际或潜在健康问题反应相关的广泛问题，旨在描述、探索和解释健康相关现象。

回顾性队列研究： 与队列研究方向一致。研究对象基于暴露或风险因素的存在与否开始，追踪至观察目标结局。但本设计使用历史存档数据（文件或数据库），从过去数据中识别暴露组与非暴露组。

（改编自循证医学中心术语表和杜克图书馆循证实践导论）

美国重症监护护理协会证据级别

A级多个对照研究的荟萃分析或质性研究荟萃综合，结果一致支持特定行动、干预或治疗

B级设计优良的对照研究（随机与非随机），结果一致支持特定行动、干预或治疗

C级质性研究、描述性或相关性研究、整合综述、系统评价或结果不一致的随机对照试验

D级经同行评审的专业组织标准，附临床研究支持建议

E级基于专家意见或多个病例报告的理论证据

M级仅制造商建议

（Armola RR等. (2009) AACN证据级别：新变化? 重症护理护士杂志. 8月;29(4):70-3.）

研究设计流程图

图示：不同类型研究的流程图（Q1、Q2、Q3指"研究设计识别"部分的三个问题）

循证医学中心

什么是"置信区间（CI）"？

置信区间（CI）用于表示总体均值可能落入的范围。多数研究者采用95%置信水平，意味着接受5%的治疗决策错误风险。若0落在置信区间内，可判定两种治疗无显著差异；若0在区间外，则存在统计学显著差异。

（Halfens, R. G., & Meijers, J. M. (2013). 回归基础：统计学导论. 伤口护理杂志, 22(5), 248-251.）

什么是"p值"？

分类（名义）检验

当因变量（结局变量）为分类变量（如两种伤口治疗的愈合情况：愈合vs未愈合）时适用。常用检验为卡方检验（χ²），通过比较观测频数与期望频数的差异计算卡方统计量。期望频数指两变量无关联时应出现的频数。

基于卡方统计量得出概率（p值），表示两均值无差异的概率。研究者通常以p<0.05为显著差异标准（即概率≤5%时判定存在显著差异）；p≥0.05则表明均值无显著差异。

（Halfens, R. G., & Meijers, J. M. (2013). 回归基础：统计学导论. 伤口护理杂志, 22(5), 248-251.）

【全文结束】

快速导航

国内健康

环球医讯

健康科普

医药资讯

家医百科