论文部分内容阅读
背景介绍Meta分析是汇集同类多个相互独立的研究结果进行定量分析,以期获得一个综合性结论的统计方法。通过合并所有相关研究的信息,meta分析可以比单个研究提供更准确的效应值估计。Meta分析的主要目的是估计综合效应量(overall effect size),包含其点估计和区间估计,估计的手段依赖于固定效应模型(fixed-effect model)或随机效应模型(random-effects model)。综合效应量的点估计值实质上是各个研究效应量的加权平均值,其权重的分配依赖于对效应量分布的假设。固定效应模型假设所有研究的真实效应是相同的,观察到的研究间的效应差异只是因抽样误差所致。相反,随机效应模型假设真实效应在研究间是变化的,它有可能受到年龄、性别、疾病严重程度、病程等因素影响而导致研究间的效应出现差异。对于随机效应模型,如何准确估计研究间的异质性对综合效应量的正确估计非常重要。异质性是通过估计研究间效应的方差来考量的,这种研究间效应的方差又称为随机效应方差或异质性方差(heterogeneity variance)。异质性方差估计方法目前估计异质性方差的方法至少有12种之多。主流的meta分析软件(包括RevMan、Stata、Comprehensive Meta-Analysis和Meta-Analyst等)所采用的异质性方差估计方法有3种,一种是由DerSimonian和Laird提出的DL方法,其特点是简单且不需要迭代计算:另外两种迭代估计方法分别基于最大似然(maximum likelihood, ML)和限制性最大似然(restricted maximum likelihood, REML)。 REML区别于ML是由于它考虑到综合效应量和异质性方差是从同一个数据中集中估计出来的,会造成自由度的较少,所以对似然函数进行了调整。Rukhin认为由Paule和Mandel提出的一种估计方法(PM),可解释为REML方法的一种简化形式,且近似广义Bayes估计。Cochran介绍了一种基于方差分析思想的估计方法(CA),其假设所有研究提供了相等的信息。Kacker和DerSimonian发现CA、PM和DL这3种方法均是矩法的不同形式,并在CA和DL方法基础上提出了相应的两步(two-step)法(CA2, DL2)。Sidik和Jonkman重新对效应量方差构造参数,提出了另一种简单且无需迭代的估计方法(SJ),并在后续的研究中提出了基于CA法估计值为初始值的一种能提高统计性能的方法(SJ_CA)此外,还有Hunter和Schmidt;方法(HS)和Hartung和Makambi方法(HM),以及一种经验Bayes方法(EB)。上述12种估计异质性方差的方法中,根据是否进行迭代计算分类,PM法、ML法、REML法和EB法是迭代法,其余均为非迭代法。若根据是否因估计值出现负数从而截断为0进行分类,HM法、SJ法及SJ_CA法对估计值不进行截断,而其余方法均有可能出现负值,从而截断设为0。另外,CA法、DL法、PM法和两种两步估计值(CA2法和DL2法)均是矩法的不同形式。针对异质性方差估计方法,许多学者进行过比较研究。其中Sidik和Jonkman的模拟研究较为全面,比较了上述12种方法中的7种(CA、DL、SJ、SJ_CA, ML、REML和EB),发现目前常用的3种方法DL、ML和REML并不优良,除非真实异质性很小,否则会有很大的偏差。不过这一研究较为局限,其纳入研究数是在10以上,而实际情况下,meta分析所纳入研究数多在10篇以下。综合效应量置信区间估计方法关于综合效应量的区间估计,最经典的方法是DerSimonian和Laird提出的基于标准正态分布的估计方法,也是目前常用的meta分析软件中唯一的方法。但该法在研究数较少时效果不理想,此时,Follmann和Proschan提出基于t分布的方法较之正态分布方法可以提高置信区间的覆盖率(coverage probability)。Hartung提出了一种对综合效应量的方差进行加权的t分布方法。另外,Sidik和Jonkman提出基于稳健方差估计的t分布法。Brockwell和Gordon应用模拟方法估计综合效应量置信区间的0.025和0.975分位数,并据此来计算95%置信区间,故称为分位数近似法(quantile approximation, QA)。还有Biggerstaff和Tweedie提出的一种方法(BT)以及Hardy和Thompson提出的轮廓似然法(LR),但此两种方法计算较为复杂。关于置信区间比较的研究并不少见,但大多只将标准正态法与其它一种或两种方法进行比较。Sanchez-Meca的模拟研究显示,基于加权方差t分布的方法的统计性能优于其它方法,不受异质性方差估计方法、异质性大小、研究数和样本量的影响,最为稳健。然而,他的研究只针对效应量为标准化均数差(standardized mean difference, SMD),且未考虑BT法和LR法以及基于稳健方差t分布的方法。终上所述,对于哪种异质性方差估计方法最为准确,尚无确切答案,尤其是当研究数较小时。且当效应量为OR值时,各种置信区间估计方法的统计性能尚有待研究。研究目的本文拟通过Monte Carlo模拟,选择更符合实际应用的参数值,比较各种异质性方差估计方法和综合效应量置信区间估计方法的统计性能。模拟方法本文选择meta分析中常用的OR值为效应量。因meta分析时OR值是对数化后参与计算的,所以本文实际采用的效应量为lnOR。模拟方法的主要思想是产生k个2×2四格表,从而计算k个lnOR值及其标准误,由此估计上述方法的异质性方差和置信区间。若四格表有格子数出现等于0的情况,则对此研究的四个格子均加上0.5。综合效应量的置信区间计算时预设检验水准为0.05,即计算其95%置信区间。本此模拟考虑3个参数,即综合效应量θ、研究数k和异质性方差τ2。1)θ=-1,-0.5,0,0.5,1,共5个水平。2)k=3,5,8,10,15,20,30,50,共8个水平。3)τ2=0,0.1,0.2,0.3,0.4,0.5,0.75,1,1.25,1.5,1.75,共11个水平。此外,计算置信区间时,我们还加入了最优权重(optimal weight),即将设定的异质性方差参数值τ2代入计算权重。值得注意的是,当τ2=0时,除了以不同异质性方差估计值代入公式后在随机效应模型下评价各种置信区间估计方法的优劣,此时,同样可以将最优权重代入公式并基于固定效应模型来评价各种方法的适用性。本研究采用偏差(bias)和均方误(mean squared error, MSE)来评价异质性方差估计方法的准确性,并采用置信区间的覆盖率(coverage probability)来评价各种置信区间估计方法的优劣。结果异质性方差估计方法PM法和EB法的整体性能表现最好,SJ_CA法次之。CA法在所有情况下均高估了τ2,SJ法在大多数情况下高估了τ2。DL法、ML法和REML法在大多数情况下低估了τ2。HS法、HM法、CA2法和DL2法普遍低估了τ2。随着研究数的增大,ML和REML估计值的差异逐渐减小。综合效应量的点估计基于所有异质性方差估计值所计算的综合效应量非常接近。除了异质性方差趋于0时,其余情况下所有方法均高估了综合效应量,但高估程度很小。综合效应量的置信区间估计方法当使用最优权重时,基于正态分布估计的置信区间平均覆盖率95.48%非常接近于设定的置信水平95%,基于加权方差和稳健方差的置信区间平均覆盖率(95.25%;94.94%)同样也非常接近。然而,基于t分布和QA法则明显高估了(97.78%;98.08%)。当使用各种异质性方差估计值时,基于正态分布的置信区间平均覆盖率明显低于设定的置信水平95%,HS法最低,为89.09%,SJ法最高,为93.27%。且使用同一异质性方差估计值所计算的置信区间覆盖率也变化很大。当无异质性时,基于最优权重的置信区间平均覆盖率(95.30%)非常接近于所设定的置信水平。然而,基于各种异质性方差估计方法的平均覆盖率会有不同程度的偏高,从DL2法的95.88%到SJ法的98.57%。基于t分布的置信区间平均覆盖率较正态分布有所提高,除SJ法(96.76%)外,其余平均覆盖率均较接近于95%。当无异质性时,基于最优权重的置信区间平均覆盖率(97.61%)较高于所设定的置信水平,基于各种异质性方差估计方法的平均覆盖率亦是如此,从DL2法的97.94%到SJ法的99.49%。此外,在研究数最少、无异质性时(k=3,τ2=0),基于所有异质性方差估计值的置信区间平均覆盖率均达到100%。且在k=3时,基于最优权重的覆盖率为100%。基于加权方差估计的置信区间非常理想,在所有情况下其平均覆盖率均非常接近于置信水平95%。且基于不同异质性方差估计值的置信区间覆盖率非常接近,对研究数和异质性的变化也非常稳健。同样,基于稳健方差估计的置信区间也非常理想,在所有情况下其平均覆盖率非常接近于置信水平95%。且基于不同异质性方差估计值的置信区间覆盖率非常接近,对研究数和异质性的变化也非常稳健。QA法的平均覆盖率较接近置信水平95%。当使用最优权重、研究数k=3时,QA法的覆盖率非常接近于100%,其随研究数的增大而减小。无异质性时,其高估得较为严重,平均覆盖率从DL2法的98.22%到99.59%,基于最优权重的平均覆盖率亦是如此(97.95%)。BT法和PL法的平均覆盖率(91.29%;92.86%)均明显低于置信水平。研究数较少时,其低估得较为严重,随研究数增大而越接近于95%。无异质性时,两种方法的平均覆盖率较置信水平有所偏高(96.33%;96.76%)。两者相比,PL法较优。结论异质性方差估计方法中,DL法、ML法和REML法在大多数情况下会低估真实的异质性,而PM法和EB法普遍估计较为准确。不同异质性方差估计值对综合效应量的影响非常小。基于标准正态分布估计的置信区间覆盖率明显低于置信水平,特别是当研究数较少时(k≤10)。而基于加权方差和稳健方差计算的置信区间的统计性能优于其它方法,且当研究数较少时也很稳健,值得推荐。此外,这两种方法也适用于固定效应模型。