指南综合评价方法的3.0版本
指南综合评价方法的3.0版本
中华医学会临床流行病学和循证医学分会主任委员、北京协和医院感染内科教授 刘晓清
中华医学会临床流行病学和循证医学分会候任主任委员、复旦大学附属华山医院血液科教授 王小钦
指南评价工具不断升级
如果临床实践指南质量低下,其推荐意见可能会误导临床。临床实践指南发布或发表后,第一时间对其质量进行评价是关键且必要的。
早在1992年,美国国家医学院就提出高质量指南的评价指标,此后陆续有相关机构和学者不断完善指南的质量评级体系。
其中,在国际上影响较大的评价系统有两个。一是2003年发表的AGREE工具(该工具于2009年进行更新并推出其扩展版),由英国和加拿大科学家主持研发,主要包括6个领域23个条目。2018年,中国学者在此基础上研发了AGREE China,评价标准更加精简和符合中国指南。二是2017年发表的RIGHT工具,由中国和世界卫生组织专家牵头研发,主要包括7个领域22个条目。前者主要关注指南编制的方法学,后者主要关注其内容报告的完整性和透明性。
然而,以上指南评价工具就综合评价指南质量而言,仍然存在以下局限性:第一,未纳入某些影响指南质量的关键因素,例如指南的前瞻性注册和计划书等。第二,未经过信度和效度验证或验证范围和程度不足。第三,工具主要用于评估指南方法学、报告或实施等单个维度。第四,若需多维度评价,则要采用多个工具,投入大量人力和时间,且难以对多个工具的合并评价结果进行解读。
综合角度出发的STAR
2021年,世界卫生组织指南实施与知识转化合作中心联合中华医学会杂志社指南与标准研究中心组建工作组,通过概况性评价、德尔菲调查、层析分析法和共识会议研发了更全面的指南评级工具(STAR)。
STAR的优势包括:第一,研发工作组成员充分考虑地域的代表性和专业的代表性,由全国15个省、自治区、直辖市,34个不同专业(指南方法学家、统计学家、期刊编辑、临床医生)的专家组成;第二,工具包含11个领域(注册、计划书、资助、工作组、利益冲突、临床问题、证据、共识方法、推荐意见、可及性和其他)的39个条目,可同时对指南方法学质量、报告质量、透明性等维度进行评级,评级效率高;第三,经过全面的信度(内在信度和评级人员之间的信度)、效度(内容效度和效标效度)和易用性验证;第四,根据权重设置条目分值,可计算指南总的STAR得分。STAR的研发进一步完善了指南评价体系,能够推动指南评价工作更加有组织、有秩序地开展。
STAR评级如何进行
STAR评级流程共有10个步骤。
1.系统检索中国专家牵头编制并于前一年度在学术期刊上发表的指南和共识;
2.提取指南和共识基本信息,包括学科、专业、发表期刊、通讯作者信息等;
3.联系通讯作者和期刊编辑,收集指南和共识编制、传播与实施的相关材料;
4.划定指南和共识的所属学科和专业,分配至相应的学科和专业组;
5.对指南评级人员进行统一培训;
6.参与评级的所有人员进行预试验,统一评级标准;
7.每部指南或共识由2名相关专业人员和1名方法学人员独立进行正式评级,并核对评级结果;
8.STAR秘书处汇总评级结果,STAR质量控制工作组抽查评级结果,全面进行质量把关;
9.STAR秘书处确定评级结果并撰写报告,STAR执行委员会审议和批准评级结果和报告;
10.在国内外权威学术期刊发表评级结果及相关研究,所有评级数据纳入STAR网站。
















































