A. 什么是Meta分析
Meta分析是一种用来收集和整合有关一个研究问题的所有相关研究证据的科学方法,临床试验则是在病人中测试治疗效果的研究方法。
考察一个问题,只看一两条片面信息得不出合理的结论,Meta分析就是要收集和综合所有有关的信息,做出全面、无偏的结论。Meta分析常用来总结临床试验的结果。
医学存在的理由是疗效,不是产生疗效的原理。牛痘接种、奎宁,磺胺、青霉素,先有应用,而后才探究原理。但是,现代西药开发主要走的是一条相反的路,从原理到疗效。可能在研究纳入的病人中无效,而在其他病人中有效,反之亦然。还可能研究存在严重偏倚,无论显示有效或无效,都是错误的。
所以,把所有已完成的随机对照试验都找来,并把它们的结果放到一起进行比较和考察,考量了所有相关信息之后,得出结论,这个方法就是Meta分析。
目前Meta分析专指系统综述里整合结果的统计方法。总结了有关一项治疗所有随机对照试验结果的Meta分析,就是该治疗效果的最全面、权威的证据。
由此可见,在日新月日的医学突破中,在精彩纷呈的医学信息里,随机对照试验的Meta分析呈现的结论,才是医生和患者最值得信赖的科学发现和决策依据。在有关疗效的争议中,任何Meta分析的缺席,都是一个说不清道不明的论战。
Meta分析自身可能存在的最大问题是漏掉了重要研究,尤其是无效的研究,会造成高估治疗效果。一般来讲,除非是蓄意的,否则,一个Meta分析漏掉重要大型研究的可能性很小,因为它们很容易发现。另外,漏掉几个小型研究对最终结论一般影响不大。
B. meta分析的基本步骤是什么
meta分析的基本步骤是:
1、明确简洁地提出需要解决的问题,制定检索策略,全面广泛地收集随机对照试验,
2、确定纳入和排除标准,剔除不符合要求的文献,资料选择和提取,包括原文的结果数据、图表等。
3、各试验的质量评估和特征描述,统计学处理,结果解释、作出结论及评价,维护和更新资料。
meta分析的优点
1、能对同一课题的多项研究结果的一致性进行评价。
2、对同一课题的多项研究结果作系统性评价和总结。
3、提出一些新的研究问题,为进一步研究指明方向。
4、当受制于某些条件时,如时间或研究对象的限制,meta分析不失为一种选择。
5、从方法学的角度,对现阶段某课题的研究设计进行评价。
以上内容参考网络-Meta分析
C. meta分析是什么
英国教育心理学家G.Glass于1976年将Meta分析定义为:Meta分析是对具有相同目的且相互独立的多个研究结果进行系统的综合评价和定量分析的一种研究方法。
即Meta分析不仅需要搜集目前尽可能多的研究结果,并进行全面、系统的质量评价,而且还需要对符合选择条件(纳入标准)的研究进行定量的合并。
一、Meta分析的选题
Meta分析的选题是一个很重要的问题。选题不当,容易导致研究缺乏价值、研究困难或无法完成。其注意事项如下:
1、重要性。只有具有比较重要的临床意义的问题才适合作meta分析。Meta分析并不是一件很简单的事情,写一篇高质量的至少也要两个月以上的时间。如果分析的问题无关紧要,则得不偿失,也难以发表。
2、争议性。一般而言,具有争议性的问题最适合做meta分析。通过汇总多个研究结果,得到总的更可靠的结论。怎样才知道哪些具有争议性呢?优助提醒如果是某一领域的医学专家,自然会对本领域有哪些有争议性的问题比较清楚,如果是新手,则可以向该领域的专家请教,或者通过文献检索的方法知道哪些问题有争议性。如:欲研究肾移植领域哪些问题有争议性,则可以以“肾移植”,“争议”在CNKI上检索,或以renal transplantation, controversy; dispute等为关键词在PUBMED或其它医学数据库上进行检索,查到相关论文,详细阅读后即可知道哪些问题是有争议性的。
3、创新性。创新性指的是国内外还没有人做过这方面的meta分析。同样可以通过文献检索的方法来得知是否已经有人作过类似的meta分析。如打算作进食牛奶是否会增加前列腺癌发病风险的meta分析,则可以以“前列腺癌乳制品meta分析”或者“prostate cancer dairy proct meta-analysis”为关键词在相关数据库进行检索。结果发现国外已经有人做过了,那么这个课题就不太适合再做meta分析。最好的情况是别人没有进行过这方面的研究,如果已经有人做过了,但是,如果前面的研究质量不高,或者是前面的meta分析已经是很久以前做过的了,或者前面的研究指出有进一步研究的必要,那么也还是可以再做meta分析的。由于现在许多适合做meta分析的课题国外已经有人做过了,所以在中文医学杂志上看到的多是“国人×××的meta分析”。但是,由于中文论文的质量及可靠性往往不高,因此影响了meta分析的质量。
4、有明确的效应指标。对于危险因素,可以以OR/RR值为效应指标,对于肿瘤的治疗,可以以×年生存率为效应指标等等。
5、大小合适。选题太大,纳入研究的文献太多,而且问题也不明确,研究难以完成。选题太少,缺乏推广应用的代表性,而且纳入研究的文献也太少,达不到汇总的效果。一般而言,纳入研究的文献以10-30篇比较适合做meta分析。
meta分析的选题是灵魂,优助医学一直倡导好的idea能够事半功倍。
二、Meta 分析的特点
1、Meta分析本质上是一种观察性研究。
2、也遵循科学研究的基本原则,包括提出问题、搜索相关文献、制定文献的纳入和剔除标准、提取资料信息、统计学处理、报告结果等基本研究过程。
3、一般研究的不同点是利用已经存在的(发表与未发表)各独立研究结果资料,而不需要对各独立研究中的每个观察对象的原始数据进行分析。
三、Meta分析的目的
1、增加统计学检验效能通过对同类课题中多个小样本研究结果的综合,能达到增大样本量、改进和提高检验效能的目的。
2、定量估计研究效应的平均水平当多个同类研究的结果在程度和方向上不一致时,通过Meta分析可以得到研究效应的平均水平,对有争议甚至相互矛盾的研究结果得出一个较为明确的结论,而且使效应估计的有效范围更精确。
3、评价研究结果的不一致性由于研究水平、研究对象、试验条件、样本含量等不同,多个同类研究的质量可能有较大差异。通过Meta分析可以发现单个研究中存在的不确定性,考察研究间异质性的来源,估计可能存在的各种偏倚。
4、寻找新的假说和研究思路通过Meta分析可以探讨单个研究中未阐明的某些问题,发现以往研究的不足之处,提出新的研究课题和研究方向。
四、Meta分析的指征
1、需要作出一项紧急决定,而又缺乏时间进行一项新的试验;
2、目前没有能力开展大规模的临床试验;
3、有关药物和其他治疗,特别是副作用评价方法的研究;
4、研究结果矛盾时。
五、Meta分析的基本步骤
1、提出问题,制定研究计划
2、检索资料
3、选择符合纳入标准的研究
4、纳入研究的质量评价
5、提取纳入文献的数据信息
6、资料的统计学处理
六、Meta分析资料检索策略
1、先进行预检索,大致确定检索范围,根据预检索的结果修改检索策略;
2、检索时可进行必要的限定,如研究对象、语种、出版年限、出版类型等;
3、保证较高的查全率最为重要,因为漏检了重要文献可能直接影响Meta分析结论的可靠性和真实性;
4、计算机检索与手工检索相结合,并重视所得文献的参考文献;
5、要注意通过其他渠道收集如会议专题论文、未发表的学术论文、专着内的章节等通过常规方法难以检索到的文献。
七、资料的统计学处理过程
1、制定统计分析方案。
2、选择适当的效应指标连续变量一般用均数差表示效应的大小,二分变量用率差(rate difference,RD)、OR、RR等来表示效应的大小。
3、纳入研究的异质性检验
4、模型选择及统计分析得到效应合并值的点估计和区间估计
5、效应合并值的假设检验与统计推断。
6、采用图表表示各个独立研究及效应合并值的点估计、区间估计八、敏感性分析
7、按不同的研究特征,比如不同的统计方法、研究的方法学质量高低、样本量大小、是否包括未发表的研究等,对纳入的文献进行分层Meta分析,比较合并效应间有无显着性差异。
D. 如何做meta-analysisi
在信息爆炸的时代,对数据的二次加工显得尤为重要。那么多健康类的App和网站,或多或少都在做信息二次加工的事情。在临床科研中,meta分析则是最符合当今时代节奏的,相信所有医生都对其有所了解,想要通过meta分析发表文章,指导临床行为。Meta分析就是对已发表的他人文献进行二次加工,并根据经验和分析标准对数据进行定性和定量的合成,在不做实验的情况下得出质量很高的科学结论。本期,小编通过解读一篇文章,来给大家介绍下如何才能做一篇高质量的meta分析。
这篇文章于2004年发表在JAMA上,是关于维生素D和跌倒之间关系的一项研究。原文如下:
Bischoff-Ferrari, HA et.al “Effect of vitamin D on falls: a meta-analysis”.JAMA (2004).
Meta分析总体可分为三个阶段:选题和立题阶段、施行阶段、分析结果和报告阶段。
第一阶段:选题和立题
第一步:确定评价问题的创新性和必要性
(务必搜索已发表或正在进行的系统评价,以避免重复工作)
搜索常用的数据库,包括:Medline、EMBASE等;
Cochrane 数据库整合了Cochrane Database of Systematic Reviews,Database of Abstracts of Reviews of Effectiveness (DARE),Health Technology Assessment Database。
在例文中,作者阐述了做这篇meta的原因如下:
1)老年人中跌倒频发,后果严重;
2)维生素D可能有效,但是之前的各RCT结果不明确;
3)之前没有做过系统评价。
如何衡量meta分析文章的质量呢?可以从以下几个角度入手:
1. 所评价的问题是否明确,比如研究人群、干预(暴露因素)、比较组、结果和研究设计(PICOS)?
2. 搜索战略是否合适?有没有任何语言限制、发布状态限制、或出版日期限制?
3. 在试验选择中是否采取了预防性措施以尽量减少偏差和错误?
4. 评估标准是否适当?
5. 在数据提取过程中是否采取了预防性措施减少偏差和错误?
6. 所选试验是否有足够的细节?
7. 数据整合方法是否恰当?各文献间差异性是否评估?
8. 作者的结论和结果是否匹配?
9. 这个评价是否是最新的?
只有知己知彼,才能创作出高质量的meta分析的文章。
第二步:制定评价方案
先确定方法。这对降低偏倚风险非常重要(比如:不能通过结果挑选文献等)。
在进行meta分析过程中,常规需要经历以下步骤,且每一步都要有明确的方法:
-锁定评价问题
-纳入/排除标准
-文献检索策略
-对检索到的研究进行选择
-数据提取
-质量评估
-数据整合
-计划传播
锁定评价问题已经在第一点中提及,接下去会对每一步进行分析,考虑到步骤间的交叉,所以在顺序和分点上有所改变。小编也推荐参看******* 2015年11月20日的文章“在这里,学会最全的PICOS原则”。
例文根据PICOS原则,可以归纳如下:
1. 所探究的问题是:维生素D是否可以阻止老年人跌倒?
2. 研究人群:老年人;
3. 干预/暴露因素:维生素D;
4. 结果:摔倒在地;
5. 研究设计:仅包括之前发表的各RCT。
第二阶段:施行阶段
第一步:文献检索
在制定文献检索策略时,总体的要求就是查全和查准。
需要考虑如下几个方面:
1. 圈定搜索数据库(外文有:MEDLINE、the Cochrane library、医学文摘、TOXLINE、OVID、EMBASE、ISI Web of Science、EBSCO等;国内有:维普全文VIP、CNKI、万方数据库)
2. 确定语言类型:包括所有英语和非英语的文献;
3. 明确需要包含的研究类型:仅包含RCT,还是病例对照试验,队列研究等。
4. 明确暴露因素/治疗方法
5. 筛选关键词:这将直接影响文献检索的准确性和敏感性,也关系到指定检索策略。
- 关键词需要根据研究问题本身来确定;
- 对于每一个关键词尽量包含所有可能的表述形式;
- 可以尝试几种关键词组合以搜最合适的文献。
6. 检索获取摘要和全文:其中联系专家是一种很好的方式,不仅可以获取全文,甚至可以询问文献中的细节帮助后续使用文献。建议搜索文献引用名单,可以增加文献搜索的全面性。
在例文中,作者搜索了所有英语和非英语的文章,包括:Medline、Cochrane对照试验注册、Embase、专家、搜索文献引用名单、在美国骨骼和矿物质研究协会中的摘要。在搜索的过程中,主要使用的医学关键词包括“vitamin D” OR “vitD”, “falls” OR “accidental falls”、“human”等。
第二步:根据纳入/排除标准完成文献选择
总体来说,首先在计划书中需要描述纳入/排除标准,且这些标准不应该是看了搜索的文献后制定的,而是应从评价问题出发直接得出。
在文献筛选过程中,首先,需要由两位研究者独立通过对文献的题目和摘要进行初筛,初筛后的文献通过阅读全文进行二次筛选,然后交叉核对筛选结果,如果有分歧则通过共同讨论决定是否纳入,必要时可有第三位研究者协助解决。如果文中信息不全或信息不清楚,与原始研究作者联系获取信息。在筛选过程中,需要记录你每个步骤的选择和排除原因。至于被排除的文章,则需要在灵敏度分析中进行分析。
如例文,在这个文献中,已提前确定了纳入和排除标准,包括:仅包含RCT研究,参加人群平均年龄≥60岁,排除酗酒人群、健康不稳定人群等,而所排除的研究在灵敏度分析中进行了分析。
下面的这个流程表描述了整个meta分析纳入和排除的过程,这个流程表在meta分析中一般都是必要的。
第三步:资料选择和提取
资料提取是从符合纳入要求的文献中摘录用于系统评价的数据信息,所提取信息必须是可靠、有效、无偏的。
总体来说,在进行数据提取时必须使用数据提取表对每个研究进行数据提取,时刻记住所评价的问题以及以后的分析。有时可能需要主观决定提取的信息,所以必须由2人独立进行,核查过程中遇到不同之处应该通过讨论解决。对于无法获取必要信息的文献,则应予以排除。
从提取的数据角度,需要提取相关研究的特点、结果和质量数据。
下表给出了常需要提取的一些数据类型,非常适合各位看官收藏下来在需要时进行查看。
一般信息 文献研究特点
进行数据提取的研究员
数据提取日期
文献识别特点
- 各文献特有编号
- 第一作者
- 文章标题
- 引用
- 出版物类型、名称、发表年限
- 国家
- 资金来源
宗旨/目标
研究设计
纳入和排除标准
分组数
样本量
招募过程(如:随机方法、盲法)
随机干预的单位(如:个人还是
一组人,或者左右眼)
研究场所
研究对象的基本特点 干预措施/暴露因素
研究对象在研究开始的特点,
包括:年龄、性别、种族、社会
经济状况、疾病特点、并发症、
诊断标准、疾病分期、病例来源
等;
各对比组的研究对象数量或平均
特点(记录下是入组人数还是可
行人数或者随机人数)
干预措施进行的环境
对干预/暴露因素/或者对照组
的描述(如:剂量、应用方法、
干预时间、执行者、干预方法、
理论依据等)
对co-intervention/co-exposure
的描述
健康结局或结果(outcomes)
分析或评估单位
所用统计方法
对每一个提前确定要研究的结果
o 是否在文中有报道
o 研究中对该结果的定义
o 对该结果的测量工具和方法
o 随访的时长以及测量
对于所有干预/暴露组以及对照组
o 每组开始参加者人数(enrolled)
o 每组在分析中包括的参加者
o 每组退出者,排除,lost to FU 人数
o 总结结果数据
> 二分法:时间和/或参加者人数
> 连续:平均值和SD
在研究中所用方法(如:intention to treat, per protocol)
研究方法结果(如:odds ratio,risk ratio, confidential interval, p-value,mean difference,CI)
如果计划做亚组分析,则需要对每一组都提取以上信息
其他结果及任何与结果相关的详细信息
花费
使用的资源
不良反应事件
在最后加入“备注”一栏,可以用于输入不能填入其他栏的信息
拿例文说,就有如下图对目标文章所提取的数据进行了总结:
第四步:纳入研究的质量评价和特征描述
完成数据提取后,就需要对所选择的文献进行质量评估。常常通过评价一个研究在设计、实施和分析中防止和减少系统误差(偏倚)和随机误差的程度,来评价其研究质量,并以此为依据在敏感性分析、亚组分析中给以不同的权重。
评估的角度有很多,常需要包含以下领域条目:
研究设计是否与研究目的相匹配
偏倚风险
结果选择
统计问题
报告方式
干预/暴露测量
下面,陈列一下常用的文献质量评价工具:
1. 随机对照试验的质量评价工具:
Cochrane风险偏倚评估工具(最常用)、PEDro量表、Delphi清单、CASP清单、Jadad量表、Chalmers量表、CONSORT声明(不专用,但可以用)。
2. 观察性研究的质量评价工具:
(1)NOS量表(最常用):病例对照研究和队列研究;
(2)CASP清单:病例对照研究和队列研究;
(3)JBI标准:横断面研究;经验总结、案例分析及专家意见;
(4)AHRQ;
(5)Combie横断面研究评价工具;
(6)STROBE声明;
(7)STREGA声明。
3. 非随机对照实验性研究的质量评价工具:
MINORS条目、Reisch评价工具、TREND声明。
4. 诊断性研究:
QUADAS工具、CASP清单、STARD声明。
5. 动物试验:
STAIR清单、CAMARADES清单、ARRIV指南。
在该例文中,共有三名作者独立进行数据提取,使用已经设计好的数据领域,包括研究质量指数,评估了以下方法:随机方法、随机分配、双盲等。此外,还做了灵敏度分析。
第五步:数据整合
系统评价过程中,对上述数据进行定量统计合并的流行病学方法称为Meta分析(Meta analysis)。Meta意思是more comprehensive,即更加全面综合。
对数据的整合分为描述性整合和定量整合:
对于描述性整合,应考虑:
• 建立干预/暴露因素是如何导致结果的假说,包括原因和适用人群;
• 初步综合纳入的研究,以文本形式或者制表和/或图形显示;
• 探讨各研究内或各研究间的关系;
• 评估证据的稳定性;
• 评估meta分析的重要性。
对于定量整合,则可以:
1. 提高了统计检验的power和精度;
2. 统计结合各研究结果给出一个“平均”干预效果的合并估计值,改进对作用效应的估计;
3. 评价结果一致性,解决单个研究间的矛盾;
4. 解决以往单个研究未明确的新问题。
那么如何进行meta分析呢?
a.异质性检验(齐性检验)
由于纳入文献存在临床异质性、方法学异质性和统计学异质性,所以在对结果数据进行统计合并之前,首先应该进行异质性检验,保证现有的各独立研究间的结果的不同仅仅是由于抽样误差造成的。否则,就要进入亚组分析,或取消合并。
异质性评估(Heterogeneity assessment)
异质性:除抽样误差外的不同性
Chi-square test for interaction (Q = x2 statistic, df =degrees of freedom)
也可以比较各亚组的点估计是否相同
若同时如何I2<50%和P≥0.1时,纳入文献被认为是同质的,采用固定效应模型(fixed effect model)分析;反之说明研究间存在实际异质性,需要查找一致性的来源,之后采用随机效应模型(random effect model)。
如果存在较大的临床异质性,那将无法进行meta分析,只能进行描述性整合。
在JAMA这篇文章中,用Q值来评估异质性。当p值小于0.1时,存在显着异质性。此外,在forest plots中所有研究的95%置信区间相互之间重叠可支持不存在异质性。
b.统计合并效应量(加权合并,计算效应尺度及95%的置信区间)并进行统计推断
通常在考虑采用哪些效应指标(effect size)时需要考虑结局指标的类型,通常两组间比较时,如果是连续性变量用加权均数差(weighted mean difference, WMD)、标准化均数差值(standardized mean differences, SMD)表示效应大小;二分类变量则用率差(rate difference, RD)、比数比(odds ratio, OR)、相对危险度(relative risk, RR)、相对危险度降低值(relative risk rection, RRR)等来表示效应的大小。
c.图示单个试验的结果和合并后的结果
-森林图(Forrest plot)
分别展示了纳入的每一篇文献的结果和合并后的结果。
-Meta-regression (Goodman et al, 2009)
d.敏感性分析:用来评估meta分析结果的稳定性
1)按研究质量评价标准从纳入文献中去除尚有争议的研究、排除低质量的研究、早期研究、根据研究结果的分布去掉extreme10%其他已知因素不同的研究;
2)采用不同统计方法/模型;
3)根据样本量大小进行分层分析;
4)改变纳入/排除标准时,重新对同一资料进行分析时,如果观察到合并指标点估计和区间估计的变化存在较大差异,则说明meta分析的结果不稳定。比如,当排除一篇低质量文献时,合并指标变化很大,说明该文献对合并指标敏感。
敏感性分析是必要的,无论是采用不同的统计模型或进行亚组分析,都可以帮助我们找到可能的偏倚来源,更加正确的理解获得的结论。
e.通过“失安全数”的计算或采用“倒漏斗图”对入选文献进行潜在的发表偏倚(publication bias)的评估。
可以用stata软件进行Begg test和 Egger test以及funnel plot进行评估。
第三阶段:报告和分析结果
第一步:报告和建议
• 总结主要结果
• 判断结果的有效性
• 判断结果概括性
• 确定进一步研究的意义
• 确定临床实践和公共卫生的意义
根据Centre for Reviews and Dissemination(CRD)指南,meta分析报告的结构一般包括以下内容:
• 标题
• 内容列表
• 缩写/术语表
• 内容提要或结构式摘要
- 背景
- 目标
- 方法(数据来源、研究的选择、数据提取,
质量评估、数据合成)
- 结果
- 结论
• 正文
- 背景/介绍
- 研究问题
- 研究方法
o 确定研究
o 研究选择(纳入/排除标准,方法)
o 数据提取
o 质量评估
o 数据整合
- 结果
o 纳入和排除研究的详细信息
o 研究结果
o 次要分析(例如:异质性、灵敏度)
- 讨论
o 主要发现的讨论
o 评价的优点和弱点
o 结果的意义
> 评价中证据的长处和短处
> 影响的方向和力度
> 结果的实用性
o 启示
- 结论
o 实践/策略/政策/未来影响
• 致谢
• 资金来源
• 利益冲突
• 参考文献
• 附录
第二步:应用到实践
让研究更易理解
推广到临床实践:诊断、预后、预防、治疗
风险评估
- 评估一般或特定的因果关系
- 与其他种类的数据使用证据权重分析(例如:毒理学、模式-的动作)
- 限制法规
附Meta分析常所使用的软件:
1. 付费软件:CMA(ComprehensiveMeta Analysis)、Meta Win、EasyEA;
2. 免费软件:RevMan(Review Manager)、Meta-Disc、EpiMeta、R;
3. 通用统计软件中有Metaanalysis的程序:STATA、SAS、NCSS、WinBUGS。
E. 什么是meta分析
Meta分析中文译为“荟萃分析”,定义是“The statistical analysis of large collection of analysis results from indivial studies for the purpose of integrating the findings.”中文译为:对具备特定条件的、同课题的诸多研究结果进行综合的一类统计方法。
F. 请教高手,META分析一般有哪些分类方式 或者说META分析的数据来源一般有哪些 不同数据来源有何特点
互动网络中对META分析的介绍比较详细,可以参考:
需要说明的是,作为一种统计学方法,META分析的核心在于大样本对可信度的提高效果,而对数据的分类恰恰体现了研究者对课题理解及对数据所包含意义的理解。也就是说,你的研究的创造性就体现在你对数据的分类上。至于数据处理和对处理结果的分析不过是证明你对数据进行分类所依据的假设。因此,不必太在意别人的分类方法,深入考察自己对课题及数据的理解即可。
我的一个朋友就曾经找我借心理统计的书进行学习,将其中的统计方法用于海底底层年代的测量,他的成就在当年是世界水平的,曾经在两届英国剑桥举行的国际海洋地质学会上做过发言。只可惜他去世早,否则前途不可限量。
祝你成功。
G. 关于meta分析软件使用方法
http://www.verycd.com/groups/jiaoxue/329595.topic
Meta分析是一种对同一主题下的多个独立实验(研究)进行综合的统计分析方法。它萌芽于本世纪初[2];1976年由美国教育学家定义为Meta分析,并揭开了它在教育学、心理学及医学中的应用的新篇章[3]。Meta分析在这些学科的应用中取得了极大的成功,发展出了多种分析方法。Mann称其为医学方法学研究中的一次革命,且羽翼渐丰[4]。
直到90年代,此方法才被生态学家发现,虽然目前它在生态学中的应用实例还很少,但已引起了生态学界的高度重视。Gurevitch(1993)出版了第一部生态学中的Meta分析专着[5],并与人合作于1997年发行了MetaWin软件包。
在我国,彭少麟(1988)首次将此方法引入我国生态学界[6],并利用此方法进行生态学分析[7]。
Meta分析目前主要应用于对照实验的综合研究中,目的为判断实验中的处理会对实验对象产生正或负效应;效应是大还是小;同一主题下不同独立实验的结果是否一致,变异程度有多大等问题。
但Meta分析决不仅仅是一个数学分析过程,它本身也是一项研究,需要认真设计。主要步骤如下所述。
提出所要解决的问题并制定搜集、选择文献的标准。搜集文献,这是一项非常繁重且关键的工作。为了能搜集到全面的文献,通过各种途径来最大可能地收集已发表的和未发表文献(包括正式期刊中的论文、会议论文、摘要以及各种私人交换资料等)。
标定各研究的特点,并对其进行分类。根据研究背景特点的不同将所有研究分为几个级别(class),以作比较。
定量测度研究特点。为了避免分析时对质量不等的研究给予相同的结合标准,导致分析结果的不准确,分析家们提出了定性Meta分析,即制定标准,对研究特点进行打分评估;综合研究结果并结合研究特点来分析结果。也有人称这一步为定量Meta分析,以相对于定性Meta分析。
研究特征分析(敏感性分析),分析研究的基本特征(研究对象、研究环境等的特征)和方法学特征对效应值之间的协变关系。
目前已有发展出多种定量Meta分析方法。但它们的基本思想是一致的,那就是先提出假设,构造一个结合统计量,然后计算各研究的结合统计量,并用其在定性Meta分析中所得分数去权重它的结合统计量;计算各级别研究中的加权平均结合统计量(在平均过程中,要根据其各结合统计量的方差进行权重);做各级别研究间统计量的异质性检验。
定量Meta分析方法的不同主要在于结合统计量和统计假设的不同。
2 MetaWin软件的特点
MetaWin是一个主要为生态学工作者设计的定量Meta分析软件,其主要特点如下所述。
2.1 提供了两种假设模型
这两种假设模型为固定效应模型和混合效应模型,具体计算过程见文献[6]。两者的区别主要在于前者假设所综合的研究共享一个真实效应大小,实际测量的效应大小不同是由于随机取样所导致,而后者却假设研究间具有不同的真实效应大小,即所测效应大小的不同是由两部分组成,真实效应的不同,随机取样造成误差。后者更切合实际,区间估计较保守,更受Meta分析家们欢迎。
2.2 提供多种可选择的结合统计量
在生态学领域内的Meta分析中最常用的结合统计量为Hedges’d效应值:d =(Xe -Xc)/(SJ)(其中,Xe、Xc分别为实验组和对照组的测量平均值,S为两组共同标准差,J为小样本较正值),MetaWin还提供了反应比(response ratio):ln(Xe /Xc)(Xe、Xc的意义同上)这是从医学Meta中新引进的一种结合统计量;此外,MetaWin还为对Meta分析较为熟悉的分析者提供了更多的选择机会,如相关系数(correlation coefficient)等。
2.3 提供了两种数据输入方式
对有经验的分析者可直接输入效应值、样本方差等所需数据,其格式称效应数据格式。这种数据输入法的好处在于分析者可根据所收集的文献的实际情况来自己构造结合统计量,也即MetaWin为分析者提供了较大的自由。在文献数据满足前两种结合统计量计算情况下,分析者可以输入原文献中的统计数据,如平均值、样本方差、样本大小来进行计算,比较方便,称原始数据格式。
2.4 提供了一项非参数检验——重取样检验
上述参数模型检验是在假设所有研究中的实验组和对照组观测值均遵循正态分布情况下进行的;许多Meta分析方法基于大样本近似原理,即当实验组和对照组样本大小不小于10时,效应值才趋于正态分布。但如果样本太小,实验组和对照组样本大小太悬殊或效应值太大时,大样本近似原理就变得不准确了[8]。但事实上,许多生态学观察值却违背了上述情况[9]。此外,只有当上述假设被满足时,用于检验研究间效应异质性的Q值才有近似的X 2分布[7]。重取样检验法是取代传统参数和非参数检验的一种好方法。
重取样检验是一种计算机加强(computer intensive)非参数检验方法[10]。MetaWin中提供了随机化检验法(randomization test)和自助法或靴襻法(bootstrap)。前者常被用来决定一个统计量的显着性水平,后者则用于给出统计量的置信区间。
MetaWin中用自助法来计算所有研究总效应值和每一级别加权平均效应值的置信区间,对于样本含量为i的每一级别,我们均以放回式取样选取i个研究并计算其加权效应值,然后重复上述取样方法多次,按大小顺序将效应值排列起来,在两端取2.5%处的值做为5%至信区间的上下限,置信区间包括零在内的级别被认为没有显着不等于零。但当样本含量太小时,会出现区间估计过低,此时,可用偏差较正法[9]。
MetaWin中用随机检验来判断级别间效应大小的差异是否显着。首先用原始数算出QB,然后将j个级别里的所有研究混在一起,再随机将它们分成j个级别,级别含量仍与原来相同,算出QB值,重复此过程多次,得出一个QB值的分布,QB的显着性水平为随机QB值大于等于实际QB值数占重复随机取样数的百分比。
3 MetaWin软件的使用方法
3.1 MetaWin软件构成
运行MetaWin,只需一台装有Windows95、Windows3.1或WindowsNT的IBM兼容机,其中共包括8个文件。(1)MetaWin.exe:在Windows95和WindowsNT下的可执行文件。(2)MetaWin.hlp:在Windows95和WindowsNT下的帮助文件。(3)MetaWin.cnt:在Windows95和WindowsNT下的帮助文件的内容。(4)MetaW16.exe:在Windows3.1下的可执行文件。(5)Meta16.hlp:在Windows3.1下的帮助文件。(6)Raw.dta:以原文献统计数据输入数据的格式示范文件。(7)Effect.dta:以效应大小输入数据的格式示范文件。(8)Gur-hed.dta:作者的示范数据格式文件。
Windows95和Windows3.1版本的不同之处主要在于研究特征类型量、每一特征类型中级别数、每一数据文件中所含研究量及非参数检验中的重复数的最大值的不同,Windows95比Windows3.1范围更广。
3.2 MetaWin软件使用方法
3.2.1 数据输入
打开MetaWin文件,下拉file菜单,点击edit data file,进入数据输入状态,可直接在弹出的窗口中输入数据,也可从file菜单中点击load a file上载已有的文件。原始数据输入格式如下:
sex tree state +/- Nc Ne Xc Xe Sc Se Label
m oak pa + 7 7 78.14 79.71 40.650 40.650 study1
m maple ny + 7 7 18.86 26.00 9.170 9.170 study2
f maple ny - 6 6 -1.80 -2.10 0.490 0.490 study3
其中,第一行为标题行,前3项为级别分类标准,事实上,Windows95版本可允许10个分类标准,Windows3.1为5个;+/-为方向符,如果你所期待的效应值为正值时(即实验中的处理会对实验对象产生正效应),在按所期待趋势应该出现正效应值的研究项中加+,负效应值的研究中加-,它必须紧跟级别组,否则程序运行时不能识别数据文件中共有几项划分级别标准;Ne、Nc分别为实验组和对照组的样本含量;Xe、Xc分别为实验组和对照组的测量平均值;Se、Sc分别为实验组和对照组的标准差;Label为各研究的标记。标题行下面的每一行为一个研究的效应数据。效应数据输入格式为:
sex tree state +/- Nc Ne effect var Label
m oak pa + 7 7 78.0.036 0.286 study1
m maple ny + 7 7 0.565 0.347 study2
f maple ny - 6 6 1.533 0.517 study3
其中,effect一列为效应值;var为效应方差;其它同原始数据格式。
3.2.2 数据分析
在打开MetaWin文件的同时,会自动弹出一个Meta-Analysis窗口。在此窗口上部Type of Input一项中点击raw或 effect(确定数据为原始还是效应格式),原来灰色的Data file就会加亮,点击,从弹出的‘打开’窗口中选定并打开要分析的数据文件。
在Meta-Analysis窗口中部选择固定效应或混合效应模型,结合统计量,也可增加重复检验;窗口下部gourp by中可选择划分级别的标准,并在Refine Analysis中可以在不改变数据文件的情况下去掉一些级别或研究来纯化分析。
所有这些选项选择好后,即可点start键进行运算。运算结束后,会自动弹出一个Meta-Analysis output窗口,显示分析结果。
3.2.3 结果显示
在分析结果中,可看到分析时间,数据来源路径,以及名为Parametric methods和 Meta-Analysis results for groups的两个表。前者为所有研究的效应值表,每一行代表一个研究,包括其名称、所属级别、小样本校正值(J)、对照和实验两组的共有标准差(spool)、效应值(d)、95%的置信区间(95%CI)、各研究的方差(V)、权重(W)。
一般先假设所有研究享有共同的d值进行分析,此时在第二个结果表中可看到所有研究的总平均效应值(d++)、95%的置信区间、同质性(Qwi),自由度(df)、X 2检验的p值。如果其级别内异质性经X 2检验显着,则说明假设不正确,此时按一定的标准将所有研究划分为几个级别,再进行分析。此时的第二个结果表中会显示各级别内所有研究的加权平均效应值(di+)、95%的置信区间、同质性(Qwi),自由度(df)、X 2检验的p值以及级别间同质性(Qb)、级别内总同质性(Qw),总的同质性(Qtotal)。如果级别间同质性(Qb)经检验后显着,则说明级别间差异显着;如果某一级别内同质性(Qwi)经检验显着,说明这一级别内各研究的效应值差异较大,应该进一步划分此级别,再分析,直到Qwi经检验不显着。
如我们在做捕食关系的Meta分析中发现,捕食者导致被捕食者种群数量降低,d++=-0.3855(固定效应模型)d++=-0.4589(混合效应模型);但不同标准划分的级别的效应大小有差异,捕食效应随地带性而变化,热带效应值最大,亚热带、温带、寒带也有效应,其中亚热带最小;按所在生态系统划分级别时,陆生生态系统级别为中效应,淡水生态系统为小效应[10]。
MetaWin是一个操作简单且功能较全的Meta分析软件,以Windows作支持,用户通过界面与机器直接对话,分析过程简单易学,结果输出明了。遗撼的是MetaWin中没有考虑定性Meta分析所得出的研究质量评估值,所以利用原始数据直接输入法不能对效应值进行研究质量权重。同时值得注意的是MetaWin只提供了定量Meta分析方法,而Meta分析本是一项研究,数量分析前需要认真设计,分析后也需对结果进行研究特征分析。一个好的Meta分析不仅要选择好的定量分析方法,而且分析前设计和分析后的特征分析都非常重要,因为统计的目的是为解决问题提供科学依据。
H. 系统评价和meta分析是什么
系统评价(systematic reviews)是对新开发的或改建的系统,根据预定的系统目标,用系统分析的方法,从技术、经济、社会、生态等方面对系统设计的各种方案进行评审和选择,以确定最优或次优或满意的系统方案。
Meta分析中文译为“荟萃分析”,定义是对具备特定条件的、同课题的诸多研究结果进行综合的一类统计方法。
Meta分析适用范围
广义上的Meta指的是一个科学的临床研究活动,指全面收集所有相关研究并逐个进行严格评价和分析,再用定量合成的方法对资料进行统计学处理得出综合结论的整个过程;
狭义上的Meta指的是一种单纯的定量合成的统计学方法。
以上内容参考网络-Meta分析
以上内容参考网络-系统评价