论文部分内容阅读
目的:层次结构数据大量存在于实际研究中,其特征是在某个地理区域内、某个行政划区或特定空间范围内存在聚集性,对此数据采用传统回归模型进行分析是不合适的,因其不符合传统回归模型的独立假设,应用该方法做出的推断将可能存在偏倚,导致错误的结论。因此,本研究对处理层次结构数据的分析方法——多水平统计模型的应用进行探索,利用第四次国家卫生服务调查重庆西部扩点地区资料进行两水平Logistic回归模型的实证研究,旨在研究多水平模型在实际运用过程中的方法学问题,为以后此类数据的正确分析提供参考。方法:本研究以两周患病为反应变量,15岁及以上重庆城市被调查居民的性别、年龄、婚姻状况、文化程度、医疗保险和经济状况等为解释变量,在描述性分析和单因素分析的基础上,运用MLwiN拟合两水平Logistic回归模型,使用DIC反应模型拟合优度,将两水平模型所获得结果与二分类单水平Logistic回归模型进行对比研究。结果:1、由两水平模型分析发现重庆城市居民两周患病情况具有层次结构,在不同的街道间存在差异;2、两水平Logistic回归模型与二分类单水平Logistic回归模型所筛选变量及假设检验基本一致,但对经济状况这类具有明显地区聚集性的指标,两水平Logistic回归模型可能较二分类单水平Logistic回归模型更敏感;3、模型拟合优度检验显示两水平Logistic回归模型优于二分类单水平Logistic模型,DIC值分别为4515.06和4583.17。结论:本研究将多水平模型应用于分类变量的层次结构数据中,作为此类数据分析的新途径,此方法具有更好的适用性,能够克服传统回归模型在处理具有层次结构数据中的局限性。但是应用过程中,由于统计软件发展的限制,分类变量的多水平模型的检验、诊断和残差分析等尚有缺憾,这将是今后分类变量多水平模型开发研究的方向。