Review Manager (RevMan) ——临床医生通向 Meta 分析的桥梁 Review Manager (RevMan) ——a Bridge leading the Clinicians to Meta Analysis iseeyou 1989 年蒂姆成功开发出世界上第一个 Web 服务器和第一台 Web 客户机并将他的发明命 名为 World wide web,由此引发了一场新的信息革命和经济革命;1972 年 Archie Cochrane 首次提出循证医学的思想并将系统评价的方法应用于产科领域,从而开创了一场翻天覆地 的医学革命。Meta 分析正是循证医学合理配置资源和提高资源有限使用效率最有效的工具 [1] 。 Meta 分析简介 Meta 分析的前身源于 Fisher1920 年“合并 P 值”的思想,1955 年由 Beecher 首次提出 初步的概念,1976 年心理学家 Glass 进一步按照其思想发展为“合并统计量” ,称之为 Meta 分析[2]。1979 年英国临床流行病学家 Archie Cochrane 提出系统评价(systematic review,SR) 的概念,并发表了激素治疗早产孕妇降低新生儿死亡率随机对照试验的系统评价,对循证 医学的发展起了举足轻重的作用。Meta 分析国内翻译为“荟萃分析” ,定义是“The statistical analysis of large collection of analysis results from individual studies for the purpose of integrating the findings.”亦即“对具备特定条件的、同课题的诸多研究结果进行综合的一类 统计方法。”[3,4] Meta 从字源来说据考证有“ Meta logic: a branch of analytic philosophy that deals with the critical examination of the basic concepts of logic ”;“ Meta mathematics:the philosophy of mathematics, especially,the logical syntax of mathematics.”其中最简洁并且 一语中的的是“ Meta science::a theory or science of science,a theory concerned with the investigation, analysis, or description of theory itself.”意为一种科学中的科学或理论,一种对 原理本身进行调查、分析和描述的原理。 Meta 分析有广义和狭义两种概念:前者指的是一 个科学的临床研究活动,指全面收集所有相关研究并逐个进行严格评价和分析,再用定量 合成的方法对资料进行统计学处理得出综合结论的整个过程;后者仅仅是一种单纯的定量 合成的统计学方法。目前国内外文献中以广义的概念应用更为普遍,系统评价常和 Meta 分 析交叉使用,当系统评价采用了定量合成的方法对资料进行统计学处理时即称为 Meta-分 析。因此,系统评价可以采用 Meta-分析(quantitative systematic review, 定量系统评价), 也可以不采用 Meta-分析 (non-quantitative systematic review,定性系统评价)[5]。 参照 Cochrane 协 作 网 系 统 评 价 工 作 手 册 ( Cochrane Reviewers’ Handbook )( 免 费 下 载 网 址 : http://www.cochrane.org/cochrane/hbook.htm)制定的统一标准,Meta 分析的基本步骤如下: (1)明确简洁地提出需要解决的问题。 (2)制定检索策略,全面广泛地收集随机对照试验。 (3)确定纳入和排除标准,剔除不符合要求的文献。 (4)资料选择和提取。 (5)各试验的质量评估和特征描述。 (6)统计学处理。 a.异质性检验(齐性检验)。 b.统计合并效应量(加权合并,计算效应尺度及 95%的置信区间)并进行统计推断。 c.图示单个试验的结果和合并后的结果。 d.敏感性分析。 e.通过“失安全数”的计算或采用“倒漏斗图”了解潜在的发表偏倚。 (7)结果解释、作出结论及评价。 (8)维护和更新资料。 临床医生只需要知道 Meta 分析的基本思想,具体的统计学方法让统计学家研究,让统 计学软件帮我们完成。Review Manager(RevMan)是 Cochrane 协作网提供给评价者准备和 维护更新 Cochrane 系统评价而设计的软件,也可以说是专门为临床医生度身订做,用于完 成 Meta 分析的软件,它不仅可以协助我们完成 Meta 分析的计算过程,还可以帮助我们了 解 Meta 分析的架构并学习系统评价的分析方法,最后把完成的系统评价制作成易于通过电 子转换的文件以标准统一的格式发送到 Cochrane 系统评价资料库(The Cochrane Database of Systematic Reviews,CDSR),便于电子出版和日后更新[6]。充分利用 RevMan 软件对初次从 事系统评价的人员获得方法学上的指导有很大的裨益。 系统评价有多种类型,如病因研究、诊断性试验的评价、预后及流行病学研究等。 Cochrane 系统评价目前主要限于随机对照试验。非随机对照试验的系统评价方法学还处于 不太完善的阶段,需要进行更多的相关研究[7]。诊断试验的 Meta 分析方法与一般的随机对 照试验 Meta 分析不同,需要同时考虑敏感性与特异性,采用综合接受者工作特征(summary receiver operating characteristic curve,SROC)的分析,但 RevMan4.2 未提供[8]。本文涉及的 例子是随机对照试验的 Meta 分析,最主要的焦点将是应用 Review manager 进行统计学处理 这一部分。 Review manager 4.2 入门 RevMan 软件是国际 Cochrane 协作网制作和保存 Cochrane 系统评价的一个程序。由北 欧 Cochrane 中心制作和更新。协作网的系统评价人员均使用 RevMan 软件制作系统评价。 该软件的主要特点是可以制作和保存 Cochrane 系统评价的计划书和全文;可对录入的数据 进行 Meta 分析并以森林图(forest plot)的分析结果以图表形式展示;可对 Cochrane 系统 评价进行更新;可以根据读者的反馈意见不断修改和完善[9]。 Cochrane 协作网目前主要提供 4.1 和 4.2 两大版本的下载,后者兼容性更好及更正了前 者的一些小错误,2003 年 月 21 日后推出。在首次进入 Review manager 后,程序会提示 可以通过帮助菜单熟悉其操作,也提供了 PDF 和 Word 格式长达 99 页的使用指南(RevMan User Guide),但是帮助菜单和使用指南仅仅是对所有功能的汇总罗列,很多其实是我们临 床医生根本无需了解的,不少读者都对一些软件的“翻译帮助写法”深恶痛绝,读完后仍 抓不住重点,不知从何下手。本文主要根据读者最关心的“如何在最短的时间内掌握 Meta 分析的基本原理,理清思路,得出结果”而编写的,尽量做到“图文并茂” 。读完本文之后, 相信对 Review manager 更好的应用一定会有所帮助。本文的读者对象是临床医生,尽量避 免使用艰涩的专业统计学术语和基本原理。2002 笔者为了了解关于中晚期非小细胞肺癌支 气管动脉灌注化疗方面的进展,在导师的指导下作 Meta 分析[10],曾为如何应用 Review manager 4.1 而心焦,后来经过一番研究之后,觉得 RevMan 不仅仅只是一个优秀的统计学 软件,其后还和很多对此感兴趣的同道讨论过这个软件,请教中山大学统计学教研室的一 些老师,得益非浅。非常渴望在这里和大家一起分享其中的一些体会,让咱们立刻就揭开 它的面纱吧。 2.1 下载 使用之前首要任务是下载软件,Cochrane 协作网提供了免费的软件下载。目前可供下 http://www.cochrane.org/cochrane/download.htm#REVM (由于 Cochrane 载的链接有两个:○ 协作网在 2003 年 10 月 23 日改新版后出现的错误,建议暂时不用,详见篇末的“注释” )。 http://www.cochrane.de/original/cochrane/download.htm#REVM (储存在旧网页上,目前暂 ○ 时可用)。点击链接后就可以见到如图 所示的界面,点击右方蓝色的 revman42.exe 开始下 载,也可以用网络快车或网络蚂蚁等软件下载,记住选择好保存路径。 图1 Download RevMan4.2 for Windows 2.2 安装 双击下载文件 revman42 开始安装(图 2),连续点击 次“Next”完成安装(图 3)。 图2 2.3 图3 首次运行 Review Manager 4.2 安装成功后,首次进入 Review Manager 4.2 可以直接双击桌面上的图标,也可以通过开 始——程序——Review Manager——Review Manager 4.2 进入(图 4)。 图4 接着呈现的是欢迎的界面,在这里您需要填入 位数的 Contact ID 供您所在的系统回顾 协作组 (Collaborative Review Group ,CRG) 确认身份、First name(名)及 Last name(姓),点击 “OK”完成(图 5)。Contact ID 是您所在 CRG 的惟一标识。 图5 紧跟着出现的对话框提示“a good way to became familiar with RevMan is to go through the RevMan exercise available from the help menu.”点击“确定”进入主操作界面。 2.4 创建一个新的系统评价 让我们用一个计数资料的例子来解释:原文见《循证医学》杂志 2002 年第 卷第 期 “纵隔淋巴结切除方式对非小细胞肺癌患者术后生存的影响——4 个相关研究的 Meta 分析” 作者:杨浩贤、吴一龙、凌莉、韩璐[11]。计量资料的应用方法也会在相应的位置加以说明。 其实我们要做的只是整理好收集的数据,点击一些选项,输入数据,其余的就交给 RevMan 帮我们完成。 在主操作界面,右键单击标题“Reviews”,从菜单或工具栏中选择“Add”。在出现 的对话框中分别输入Title: 纵隔淋巴结切除方式对非小细胞肺癌患者术后生存的影响; Review no: 001;Status: Title only;Date next stage expected: 29/01/2004(您计划初步完成该 系统评价的时间)(图6)。点击“Save”保存。在随之弹出的对话框中选中“Don’t ask me again in this RevMan session” 然后点击“OK”。最后点击“Close”关闭对话框。 图6 这样就创建好了我们要进行的系统评价,单击 Reviews 下方、题目蓝色大写“T”左 侧的“+”使之变成“-”展开新创建系统评价的各级菜单,可见每一个系统评价由图 所示六个部分构成,每一部分下面还有多级副标题和项目。 图7 ●Cover sheet:主要包括了该系统评价题目和作者以及支助来源的一些基本的情况。相当于 该系统评价的封面(cover)。 ●Text of review:在这里可以录入系统评价的草案、摘要以及全文。文章的框架、格式主要 参照这一部分。 ●References:该部分提供了被纳入 Meta 分析的研究和其他参考文献相关信息的储存位置。 ●Tables:各入选研究的数据经处理提取后输入这里的表格以待 RevMan 软件计算。 “Tables” 是 RevMan 的核心部分,“References”和“Figures”中的大部分功能都可以在“Tables” 中实现,请着重留意。其实只要您不是要把您的作品以电子刊物的形式发表到 Cochrane 图书馆,只要搞清楚“Tables”这部分就基本上可以把文章炮制出来了。 ●Figures:显示各文献数据经综合定量合并分析后得出的 Meta 分析森林图和评价文献发表 偏倚的倒漏斗图(funnelplot)等。 ●Comments and Criticisms:供作者回馈 Cochrane 系统评价资料库中读者的评论和建设性的 评判。 下面我们先从“Tables”这一核心部分入手。 2.5 纳入研究的数据处理和录入 选定题目,制定检索策略,广泛系统地收集文献,按照纳入和排除标准剔除不符合要 求的文献并进行各个试验的质量评估和特征描述之后。我们就要运用上面提及的 RevMan 的核心部分——“Tables”来进行数据录入和统计学处理了。 首先我们把纳入的 个研究的数据资料提取如表 所示(见原文): 表1 纳入研究的原始文献数据表 清扫组 发表年份 作者 采样组 研究质量评估 死亡数 n 总人数 N 死亡数 n 总人数 N 1998 K Sugi A 11 59 56 1998 J.R.Izbicki A 26 76 42 93 2000 Steven M Keller B 95 186 116 187 2001 Wu Yilong A 62 160 80 160 单击 Tables 左侧的“+”展开表格的各级菜单,可见此部分由图 所示 个部分构成。 关键之处在于要先在“Characteristics of include studies”或者“Characteristics of ongoing studies”加入纳入研究之后才能在“Comparison and data”中录入数据。另一个使用的小技 巧是多使用右键,然后在下拉菜单或者工具栏中选择相应的命令。 图8 右键单击“Characteristics of include studies” ,在菜单中选择“Edit” ,在跳出的对话 框中单击右下角的“Add study”如图 9(这一操作将实现“References”中的部分功能) 。 Study ID 由“第一作者姓名+发表年份”构成,如“Wu Yilong 2001”,同法根据表 输 入 个研究的“Study ID”和“Year”,最后“Save”and“Close” 。最右方的“Allocation concealment”(随机分配方案隐藏)用于评定入选研究的随机分组方法的应用情况,分 有四个等级:A:Adequate(适当的),B:Unclear(不清楚的),C:Inadequate(不恰当 的),D:Not used(未使用) 。注意:在这里输入后各研究的排列顺序是按照 Study ID 中作者的首字母,而不是按照年份或者输入顺序。 图9 右键单击“Comparisons and data” ,在菜单中选择“Add”,在 Description 下方的文 本框中输入“清扫组 versus 采样组”如图 10,点击“OK”保存。 图 10 可以看到“Comparisons and data”左边多了一个“-”,下方出现一级菜单“清扫 组 versus 采样组” ,右键单击“清扫组 versus 采样组”,在菜单中选择“Add”,随即弹出 一个“Add outcome/category”单选框,选中“Dichotomous” (计数资料)后点击“OK” (图 11)。该选框提供了 种数据类型的选择,其中最常用的是“Dichotomous”和 “Continuous”。 z Dichotomous:适用于离散型变量的计数资料和有序变量。数据录入时需要各组发生 该结局或事件的人数和各组总人数。(详见下文) z Continuous:适用于连续型变量的计量资料。数据录入时需要各组的例数、结局指标 的均数及标准差。 z Individual patient data:单个患者数据。数据输入参照“Dichotomous”。 z Generic inverse variance:未经计算提取的数据。需要治疗效应的估计值、标准误和 入组总人数。(罕见情况下涉及) z Other data:其他数据。数据通过纯文本格式输入。 图 11 随之弹出“Dichotomous outcome/category”对话框,分为 General、Statistical、Graph 三个分页面。 z 在 General 中输入 Outcome number:01;Description:随访截尾时间的死亡和存活状 况;Group labels:清扫组(取代默认的 Treatment),采样组(取代默认的 Control)。 z 在 Statistical 中全部取默认值,Total:Yes;confidence interval:95%;Default Statistical method:Odds ratio ,Fixed effect model。 z 在 Graph 中输入 left:Favours 清扫组;right:Favours 采样组;Default graph scale: 0.1-10。 事实上,上述的各种选项在最终的结果分析(analysis)或图形显示(figures)中还 可以根据不同的情况随时调整,具体见下文。 点击“OK”后可以见到,在“清扫组 versus 采样组”的左边多了一个“-”,下 方多了一个表示计数资料的“红心和蓝十字”的图标。右键点击,在菜单中选择“Add”, 在相继弹出的选框中选择“Study”,点击“OK” (图 12)。 “Study”上方的选项“Sub-category” 适用于亚组分析。 图 12 接着会弹出一个“Add studies to data table”对话框,按顺序逐一选中刚才加入到 “Characteristics of include studies”中的四个研究,并点击“Add” (图 13)加入到图 14 所示的表格中。由于在“Characteristics of include studies”中输入的各研究的排列顺序是 按照 Study ID 中作者的首字母,而不是按照年份或者输入顺序(见上文及图 9),所以要 利用图 14 中最右边一列“order”来调整各研究的显示顺序使之和表 相符,否则容易 引起输入错误。方法是先在“order”列中输入各研究的显示顺序,如 2,1,3,4,然后 单击一下“order”,各研究就会按照您希望的顺序排列。接下来的任务就是把表 中的 数据机械地输入如图 14 的表格中。最后点击“Save”和“Close”保存。点击菜单栏中 黄色“?” 左侧的快捷方式“Analysis”后将出现如图 15 的画面(这一操作将实现在 Figures 中的大部分功能) 。 图 13 10 图 14 图 15 双击“01 随访截尾时间的死亡和存活状况”或单击其左方的灰色正方形,您就会发 现“meta 分析森林图”在一秒钟之后呈现在我们眼前(图 16)。 11 图 16 面对这个有点象 Cochrance 协作网标志的 Meta 分析森林图(MetaView),我们最关 心的当然是如何阅读。 左起第四列的“OR(fixed)95%CI”中,每一横线代表一个试验结果的置信区间 (confidence interval ,CI),横线中央的蓝点是点估计值,置信区间是真值可能存在的范 围,反映结果的准确性,横线越长,说明样本量越小,结果欠准确可靠;横线越短,说 明样本量越大,准确性越高,结果越可信。最下方的菱形代表多个 RCT 的综合结果。 垂直线(代表 OR=1,RR=1 或 RD=0)将图分为左右两半,用于判断结果差异有无统计学 意义:横线/菱形与垂直线相交则表明该 RCT 中不同治疗措施之间差异无统计学意义。 对于不利结局如死亡、疾病进展、残废事件等,横线/菱形完全在垂直线左侧表示治疗组 更有效,完全在右侧表示对照组更有效;对于有利结局如治愈、缓解等则刚好相反[12]。 左起第五列的“Weight”表示各个试验的权重。一般来说,对于计数资料如本研究 使用样本量作为权重的衡量依据,样本量越大,权重越大;计量资料则采用标准差作为 权重的衡量依据,标准差越小,权重越大。也有以纳入研究的质量评分作为权重的衡量 依据。 森林图左下方是齐性检验(test for heterogeneity)判断的依据,详见下文。 对于这个“纵隔淋巴结切除方式对非小细胞肺癌患者术后生存的影响”的系统评价, 目的是比较清扫组(治疗组)和采样组(对照组)在随访截尾时间内死亡这一不利结局 12 的发生率。总共 1998-2001 年之间四个研究入选,清扫组总共 481 例,采样组总共 496 例。综合结果表明 OR=0.67(95%CI,0.51-0.86)>0,菱形完全位于垂直线的左侧,得出 清扫组更有效的结论。 我们还可以比较两种或多种不同设计对相同问题进行的 Meta 分析是否会得出不同 的结果,也就是敏感性分析(sensitivity analyses)。这里留给读者一个问题:如剔除 Steven M Keller2000 这篇非前瞻性随机对照研究后得出的分析结果是否不同? 我们再看图 16 上面的菜单栏,这里提供了很多个性化的功能,可以使您用不同的 方式显示“Meta 分析森林图” ,这需要调整上述“Dichotomous outcome/category”对话 框中的各种选项。现在逐一把最常用的介绍如下: z File:通过文本、网页、各种格式的图片(PNG、JPG、BMP)、word 等的形式保存 或者打印“Meta 分析森林图” 。 z Edit:把结果通过剪贴板的形式输出。 z Display:通过“scale”调整森林图的显示比例;通过“confidence interval”选择置 信区间的范围;除了图 16 中显示最常用的 study ID、Raw data(原始数据)、Graph (这里指森林图)、Weight(权重)、Effect estimate and CI(效应估计量和置信区间 范围)以外,还可以显示各纳入研究的 Year(年份)、Quality(研究质量) 、User defined order(使用者定义的显示顺序) 、O-E and variance(观察-期望数及变异) 。 点击该栏最下方的“Funnel plot…”将会显示“倒漏斗图”以了解文献潜在的发表偏 倚(publication bias), “倒漏斗图”显示不对称,提示存在发表偏倚,发表偏倚的最 主要原因是阴性结果的文章发表困难。此外方法学质量低下、试验组和对照组基线 资料的差异、机遇和弄虚作假等因素也会导致倒漏斗图的不对称分布。 Funnel plot 是指从单个研究估计得来的治疗效果(x 轴)与每项研究的样本大小(y 轴)所作出的散点图形。因为治疗效果估计值的准确性是随着研究样本量的增加而 增加的,所以小样本研究的效应值应散在、宽广地分布在图形底部,而大样本研究 的效应值相对集中地分布在图形中部或顶部,由于大样本研究的效应值分布随着样 本量的增加而逐渐集中变窄。图形形状类似于一个倒置的漏斗。在没有偏倚的情况 下,呈现对称的倒漏斗状;如果存在偏倚,比如阴性结果的研究未能发表,就会出 现图形缺角。RevMan4.2 采用 1/SE 代替样本量对应效应值作图。 根据图 17 可以猜测入选的四篇文献的发表偏倚不大,但根据仅有的四个研究作出判 断仍然是依据不够充足的,因为通过“倒漏斗图”下结论的前提是在入选研究数量 13 足够多。Funnel 的对称与否没有正式的定义,RevMan4.2 中也没有提供任何检验的 方法。只是通过视觉的观察,判断结果在不同的观察者之间往往存在差异。入选研 究越少,结论就越难以统一。Egger 和他的同事开发了一种简便的 funnel plot 图形检 验方法正在越来越为 Cochrane 系统评价广泛应用。[13][14] 图 17 z Sort:可以通过 study,weight,effect estimate,year,quality,User defined order 等 多种方式排列各研究的显示顺序。 z Statistical:最实质性的一项。效应指标选择一般包括计数资料或计量资料;资料合 成方法包括固定效应模型或随机效应模型 a.对于计数资料有 Peto odds ratio、Odds ratio 、Relative risk、Risk difference 四种衡 量效应尺度的选择。 计数资料如暴露与否、生存和死亡、有效和无效、治愈和未治愈等这些非此即彼的二 分类数据用优势比(odds ratio, OR)、相对危险度(relative risk,RR)、风险差异(risk difference, RD)、风险比(hazard ratio, HR)表示干预的结果,计算中要求列出各组发生该结局或事件 的人数和总人数。Peto 法的 OR 是传统方法(Mantel-Haenszel)的一种改进,对小概率事件 结局的结果进行汇总时是最有效而且偏倚最小的方法。理清他们之间的异同非常重要,事 实上不少系统评价者在一些随机对照试验中不恰当地应用了这些效应指标。HR 和 RR 意义 相近,一般可以换用,各计数指标的比较见表 3(表 中公式的字母参照表 2)[15,16]。 14 表2 四格表 结局 是 否 干预组 A B 对照组 C D 表3 计数资料各指标的比较 OR(odds ratio) RR (relative risk) RD (risk difference) 名称 优势比 相对危险度 风险差异 定义 病例组与对照组暴露率之比 干预组与对照组结 干预组与对照组的结局 局发生率之比 发生率之差 公式 指标类型 (A/B)/(C/D) [A/(A+B)]/[C/(C+D)] A/(A+B)-C/(C+D) 相对(比值) 相对(比值) 绝对(差值) 1 病例对照研究(回顾性的病 队列研究,随机对照 随机对照试验 因学分析) 试验(前瞻性) 目前最常用于 Meta 分析中 Meta-分析中尤其在 如果两率较大,检验两率 尤其是病因学探讨中,但优 非小概率事件中使 的差值用 RD 值较好;如 越性仍有待评估。如果 用 RR 是最安全的, 果 两 率 差 值 较 小 , 则 用 A