Meta分析中三种合并requivalent方法的比较

被引量 : 0次 | 上传用户:qiuzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景Meta分析有参数方法和非参数方法两大类。自从Glass(1976)提出基于效应量的参数meta分析方法之后,此前的基于尸值的非参数meta分析方法不再被提倡。然而,直到今天,仍然有大量的初始研究缺乏效应量这样重要的信息,为了不回到选择原来的非参数meta分析的老路,Rosenthal and Rubin在2003年提出了基于P值和样本量的效应量requivalent(为方便记录本文才用其缩略记法req)概念,该统计量可通过初始研究的尸值或t值与总样本量N进行估计,即(?),式中的t值可基于t分布由P值转换而来。统计量所以用符号requivalent(req)表示,是因为该统计量等同于处理效应与服从正态分布的组间比较的P值的二值相关系数(rpb:point biserial correlation)。Rosenthal and Rubin认为这个方法尤为适合于以下情况:①当进行meta分析或其它二次研究时候,初始研究仅仅给出了P值和总样本量N;②缺乏公认效应量的某些统计推断方法,如非参数统计;③当样本量太小或数据呈非正态分布,直接计算效应量的偏差程度将大于req值所产生的误差。在初始研究或二次研究中效应量的报告表达主流是采用基参数统计方法下得出的直接效应量(direct effect size),其与二值相关系数有一种等同换算的关系:req。相对于直接效应量来说,这个req就是间接效应量(indirect effectsize)。然而在实际中,由于数据类型的多样性,参数统计方法未必适合,也就产生不了直接效应量。由此可见,对统计量req进行meta分析,使得基于非参数信息(P值和样本量)的方法变成了参数meta分析方法,这个间接效应量的思想有一定的实际应用价值以及重要意义。尽管这样,仍然不能取代一直倡导使用的主流的直接效应量。目前,在meta分析中关于合并req的估计按照权重的不同有三种方法,这三种方法的准确性如何,以及在meta分析中一些潜在因素(如发表偏性、统计异质性等)存在的情况下对三种方法的影响如何?迄今尚未有研究涉猎。故此,本研究将对合并req的三种估计方法进行比较研究,以期为meta分析的应用提供方法学依据。目的通过Monte Carlo模拟,比较meta分析中三种效应量req估计方法的优劣,并探讨三种方法的应用条件,应用条件考虑以下几个层面:①参数方法的前提条件,如正态分布、方差齐性、独立性;②初始研究的平均样本量及纳入meta分析的研究数量;③存在发表偏性及/或统计异质性的情形;④基于初始统计量r或转化统计量Z的情形。方法应用Monte Carlo模拟方法,在SAS 9.13/IML中编写程序,实现三种效应量req估计方法,考虑9种潜在影响因素,以偏倚、MSE、标准偏倚和标准偏倚可接受范围为评价标准,比较三种方法的优劣及其适用条件。1.三种合并req估计方法—HSr方法(Schmidt and Hunter):以初始统计量req为效应量,并以样本量为权重;—HOz方法(Hedges and Oklin):以Fisher z效应量(由初始统计量req转换而来)为效应量,以相应方差的倒数为权重;—HOr方法(Hedges and Oklin):以初始统计量req为效应量,以相应方差的倒数为权重。2.九个研究因素—纳入meta分析的研究个数(k):4个水平,分别为6、30、60、120;—初级研究的平均样本量(n=n1=n2):4个水平,分别为10、30、60、100:—总体分布:2个水平,分别为正态分布、中度偏态分布(斜度为1.50,峰度为3.50);—初始数据的变异(var):2个水平,分别方差相等(1:1)、方差不相等(1:10),偏态分布双变量数据参考Fleishman提出的标准正态分布转换公式:Y=a+b+cZ2+dZ3。其中Y随机变量为服从一定偏度与峰度的偏态分布,Z随机变量是标准正态分布,a、b、c为参数。本研究采用斜度为1.50,峰度为3.50,对应的a、b、c值从Fleishman的研究结果获得。—初始数据的相关性(corr):3个水平,分别为数据独立corr为0、数据非独立corr为0.2、数据非独立corr为0.7;—推断方法:2个水平,分别为t检验、Wilcoxon检验;—总体效应值(p):4个水平,分别为0.0、0.1、0.3、0.5;—统计异质性(H):2个水平,分别为统计同质性τ=0、统计异质性τ=0.2;—发表性偏倚(PB):2个水平,分别为不存在发表性偏倚、存在中度发表性偏倚(α=1.5,p=2),发表性偏倚的模拟产生方法是应用Begg & Mazumdar提出的纳入meta分析的初始研究与其P值概率成反比:Exp(-β*Pα),当(a=1.5,p=2)时属于存在中度发表性偏倚,初始研究纳入的比例约为66%。为统计分析需要,将统计异质性(H)与发表性偏倚(PB)结合分析并用PB/H表示,故产生4个水平情况,设定为:1代表发表性偏倚和异质性同时不存在,2代表发表性偏倚存在而异质性不存在,3代表发表性偏倚不存在而异质性存在,4两种同时存在。3.评价标准偏倚(Bias(req):Bias(req)=E(req-ρ)=E(req)-ρ; MSE:(MSE(req)):MSE(req)=E[(req-ρ)2]=[Bias(req)]2+Var(req);标准偏倚(Stdb(req)):Stdb(req)=100%×(req-ρ)/SEreq;其中(?),(?)是(?)的标准差。在实际应用操作中,首先考虑Stdb50的绝对值是否在50%内,然后观察偏倚的符号,继而考虑MSE的大小来评价估计方法的优异。由于标准偏倚(?),综合了偏倚与MSE的信息,是偏倚(?)依赖参数估计不确定性大小的结果。当标准偏倚(?)的绝对值大于50%,认为对效率(efficiency).覆盖率(coverage error rate)以及错误率(error rate)有负性影响。该研究对可接受标准偏倚(Stdb50)定义为-50%≤(?)≤50%。将其看作是主要的评价标准。文中记录统计分析Stdb的均数以及Stdb50的频数与构成比。结果当p=0,0.5时,三种方法的估计量的Stdb50频数为0:当p=0时,估计量过高估计,产生正偏倚;当p=0.5时,估计量过低估计,产生负偏倚。时当p=0.1时,HOz和HOr估计量的Stdb50频数较HSr的为高:HOz为605,HOr为607,HSr的为297。当p=0.3时,HOz和HOr估计量的Stdb50频数为0,HSr的为66。整体上说HOz和HOr估计量的偏倚,MSE,标准偏倚在各个条件下结果都表现为一致;而HSr与HOz和HOr在对合并req估计的结果数量大小是不一致。这种差异趋势在把这三种方法应用于由匹兹堡Carnegie Mellon大学的Dr. Michale F. Scheier提供的数据的实例分析结果中也观察得到。本研究对结果着重分析记录当p=0.1,0.3时偏倚,MSE,标准偏倚,可接受标准偏倚(Stdb50)在三个方法中出现的情况。1.在p=0.1情况下考虑各种统计学假设条件组合情况下,根据始研究数据的统计学特征①独立/非独立(3水平),②同方差/异方差(2水平),③正态/非正态(2水平),④推断统计t检验/Wilcoxon检验(2水平)组合共产生24个组合并进行研究讨论。这些组合情况代表了req观察值或者由①满足理想统计条件,②不满足一个统计假设条件,③不满足两个统计假设条件,④不满足三个统计假设条件情况下进行推断统计t检验或Wilcoxon检验的有关统计量计算得到。分别固定以上提及的24种情况,以观察纳入meta分析的研究数目,初级样本量,效应值的异质性和发表性偏倚结合情况(PB/H)因素对三个估计值的效应影响。1)就HSr估计值而言a)当k=6时,标准偏倚在可接受范围内的频数最多;在以下统计学特征的组合条件下,k=120时,标准偏倚在可接受范围内的频数为0:原始观察req的演算来自方差不齐、非独立(corr=0.2)、正态分布数据下的Wilcoxon检验;原始观察req的演算来自方差不齐、独立(corr=0.0)、非正态分布数据下的Wilcoxon检验;原始观察req的演算来自方差齐、非独立(corr=0.2)、非正态分布数据下的Wilcoxon检验;原始观察req的演算来自方差不齐、非独立(corr=0.2)、非正态分布数据下的Wilcoxon检验。b)当n=10时,在24种统计学特征的组合条件下,Stdb50频数为0;当n=100时,标准偏倚在可接受范围内的数目最多。c)标准偏倚在可接受范围内的数目值在PB/H=2或PB/H=3时后最多,即在发表性偏倚存在而异质性不存在或发表性偏倚不存在而异质性存在情况下。其中根据初级数据统计假设情况所组合成的24种情况中的]4种情况,在PB/H=4,即发表性偏倚和异质性同时存在因素水平下,标准偏倚在可接受范围内的数目值为零。2)就HOr和HOz估计值而言a)其中根据初级数据统计假设情况所组合成的24种情况中的18种情况,因素水平k=6时,标准偏倚在可接受范围内的数目最多。在24中情况中都出现k=6时MSE为最大。b)标准偏倚在可接受范围内的数目值在PB/H=3或PB/H=4时最多,即在发表性偏倚不存在而异质性存在或发表性偏倚和异质性同时存在情况下。当PB/H=1或PB/H=2,在以下初级数据统计假设情况下Stdb50频数为0。在19个数理假设条件组合都为最小标准偏倚平均值出现在PB/H=3,即发表性偏倚不存在而异质性存在中。在24种数理假设条件组合,MSE的最大值出现于PB/H=4,即发表性偏倚存在而异质性同时存在。c)三个估计值间最大的差异,存在于当初级数据不满足独立的情况其样本相关系数为0.7时。有5个这样的组合,出现如下现象:在k的各个水平,HSr估计量的标准偏倚的均量比HOz和HOr估计量为小;然而,在其他的19个组合情况下,在k的各个水平,HSr估计量的标准偏倚的均值比HOz和HOr估计量为大。d)HOr和HOz估计值在以下情况的准确性尤其受到n,统计异质性的影响:原始观察req的演算来自方差齐、独立(corr=0.0)、非正态分布数据下的Wilcoxon检验;原始观察req的演算来自方差不齐、独立(corr=0.0)、非正态分布数据下的Wilcoxon检验;原始观察req的演算来自方差不齐、非独立(corr=0.2)、非正态分布数据下的Wilcoxon检验。2。在p=0.3情况下当p=0.3时,HSr估计值的Stdb50频数为66,出现在当n=10或者PB/H=1或PB/H=4时,即存在发表性偏倚情况下。当p=0.3时,HOz和HOr估计值的Stdb50频数为0。3.实例本研究的实例数据由匹兹堡Carnegie Mellon大学的Dr. Michale F. Scheier提供。Scheier等在一个关于乐观主义与躯体健康关系的meta分析里,纳入了83个合乎要求的初始研究作为meta分析的研究对象,他们采取的效应量是r。由于不是所有的初始研究所报告的结果都以形式发表,所以Scheier等根据初始研究所提供的信息采用不同的方法都转换成共同形式的r族效应量,其中所用到的方法是Rosenthal and Rubin提出的req。本研究分别采用HSr, HOz和HOr方法估计合并req,结果分别为0.14(CI=0.12-0.17)、0.09(CI=0.07-0.11)、0.10(CI=0.07-0.13)。结论1.三种方法都没有在全部所设置的研究情况组合对合并req效应量作足够准确计。对效应量p而言,只有当p=0.1时,HSr, HOz和HOr能作出相对准确的估计。当p=0.3时以及n=10时,HSr方法只能条件性作出相对准确的估计。当p=0,0.5时三种方法都不能作出准确估计。2.影响req效应量准确估计的因素有:数据特征,统计推断方法,总体效应量大小,发表性偏倚存在与否,异质性存在与否等5个方面。3.在本研究的条件设置下,所研究的三个meta估计方法对合并req效应量估计准确性表现为条件限制式,具体为限制于当总体效应值ρ=0.1及0.3时。1)在适合应用HOz和HOr条件前提下,基于模拟及实际例子结果,直接应用req初始观察值r形式为计量值与通过Fisher转换法把的r转换成z为计量值没有明显差异,出于运算方便,建议采用HOr方法。2)在存在发表性偏倚或效应值异质性中之一,或两种均存在情况下,建议采用HOr方法。3)当ρ=0.3时,在n=10或存在发表性偏倚情况下,推荐使用HSr方法。4.总的来讲基于效应量req的meta分析准确度和可靠性均不充分,对于将来的meta分析领域,仍积极提倡基于初始的完整直接效应量进行分析,如果由于提供的信息有限而需要应用类似合并req的间接效应量方法,那么此类方法还有待改进才有可能满足理论和应用方面的要求。
其他文献
改革开放以来,随着社会主义市场经济体制的不断完善和单位体制的日趋瓦解,城市社区承担了越来越多原来由政府和企事业单位承担的社会管理和社会服务职能,城市社区的功能不断
文章简要论述了企业培训的理论研究和发展状况,对国内外的企业培训现状进行了分析,并针对企业的实际情况,对企业培训的内容、计划、实施方法进行了探讨.
创新已经成为二十一世纪经济增长与发展的主旋律,它决定着一个国家或组织在未来发展中能否保持可持续的竞争优势。在知识经济时代,知识、信息和人力资本成为经济发展首要推动
支持向量(Support Vector Machine, SVM)是数据挖掘中基于统计学习的分类算法,其优点体现在很少出现过度拟合、对于特征过多造成维数灾难不明显、收敛解是全局最优解以及灵活
为实现仿人机器人快速稳定的行走,在满足有效参数组合的条件下,提出一种基于深度强化学习的步行参数训练算法以优化机器人步态。首先,从环境中捕获机器人步态模型参数作为DQN
背景慢性阻塞性肺病(COPD)反复急性加重,肺功能进行性下降,逐渐发展为肺源性心脏病(PHD),严重影响患者的劳动力和生活质量。而继发性肺动脉高压(PAH)是COPD进展为PHD的关键环
本论文旨在探讨,与身处国外或香港的经济分析师相比,身处中国大陆的分析师是否能更准确预测中国经济的重要变量。本文也着眼于探讨在华的外籍分析机构是否比中国大陆及香港本
通过对医院科研人才的SWOT分析,找出青年科研人才发展存在的优势因素、劣势因素、机会因素以及威胁因素。针对这些因素,鼓励申报科研基金项目、建立组织标本库、完善科研管理
网络用户自主选择权是指网络用户根据自身的实际需求,在主观自愿的前提下,在非网络服务提供者诱导、胁迫的情形下自由选择服务提供商以及选择或者使用其提供的产品或者服务的