论文部分内容阅读
纵向研究中,由于获取资料所需的时间较长,可能会由于研究对象欠合作、行动不便或居住地改变等原因,不可避免地出现数据缺失。数据的缺失机制分为三种,即完全随机缺失(MCAR)、随机缺失(MAR)和非随机缺失(MNAR)。非随机缺失的资料分析,可选用的模型方法主要有选择模型(SEM)、模式混合模型(PMM)、共参数模型(SPM)及变系数模型(VCM)等,其中模式混合模型的研究目前引起研究者们的广泛关注。有关模式混合模型分析纵向监测非随机缺失资料研究,在结构上存在的可识别性低的问题逐渐引起人们的研究兴趣。为了解决模式混合模型可识别性低的问题,本文系统阐述了三种模型识别限制策略,即完全个案缺失值(CCMV)限制、相邻个案缺失值(NCMV)限制、可用个案缺失值(ACMV)限制,并模拟证实不同缺失比例及样本含量条件下,三种模型识别限制策略的参数估计。结合全国社区高血压规范化管理实例,分别采用CCMV、NCMV及ACMV识别限制,对含有缺失的高血压随访监测数据进行多重填补,采用限制极大似然估计方法(REML)实现模型参数进行估计;通过对三种模型识别限制策略分析结果的相互对比,进行敏感性分析。其主要结果如下:1、在最佳适用条件下,三种模型识别限制策略均可获得相对稳定准确的参数估计值。模拟研究结果表明,在缺失比例一定的条件下,随着样本含量的增加,三种模型识别限制策略下的参数估计值越来越接近于真值,且其标准误越来越小;当样本含量达到200时,参数估计值趋于稳定。在样本含量一定的条件下,随着缺失比例的增大,三种识别限制策略参数估计结果的标准误越来越大。当缺失比例较小(约低于30%)时,CCMV识别限制策略参数估计结果的标准误与其它两种策略相比较小,其参数估计值也较接近于真值;当缺失比例较大(约大于60%)时,NCMV识别限制策略参数估计结果的标准误与其它两种策略相比较小,其参数估计值较接近于真值;而在其他缺失比例下,ACMV识别限制策略参数估计标准误较小,估计相对准确。2、按缺失模式分层,采用三种模型识别限制策略分析社区高血压规范化管理实例,并对各模式结果进行整合,解释更客观准确。通过各缺失模式下的血压值-时间变化趋势可知,收缩压较高或舒张压较低的患者容易出现缺失。各模式结果表明,模式3、模式4下三种识别限制策略参数估计结果完全一致,而模式1、模式2下的参数估计结果则有相差。整合结果表明,三种限制策略下的参数估计结果基本一致,对收缩压而言,按CCMV限制策略填补,病程及随访时间是影响高血压患者收缩压控制效果的有意义因素,而按NCMV及ACMV限制策略填补,病程、超重及随访时间对社区高血压患者收缩压控制效果有影响;而舒张压资料三种限制策略填补结果表明年龄及随访时间对社区高血压患者舒张压控制效果有影响。3、三种识别限制策略的综合应用可作为高血压随访监测的敏感性分析。本研究中,CCMV、NCMV及ACMV限制策略分析结果可认为是不同敏感性参数下的结果。无论反应变量为收缩压或舒张压,三种识别限制策略下的模式混合模型参数估计结果基本相近,且其血压值-时间趋势线都呈现下降趋势,斜率相近且近乎平行,这表明模式混合模型识别限制策略能较好的实现对高血压缺失数据的填补与估计。