多组比较的倾向性评分模型构建及匹配法的研究和应用

来源 :第二军医大学 | 被引量 : 14次 | 上传用户:xy0382
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景:随着信息技术的不断发展,观察性研究无论是在数量上还是在研究准确性上都在不断增加和提高。大样本的观察性研究在医学研究当中发挥着越来越重要的作用。但在观察性研究中,由于研究对象所在的组别不是随机分配的,而是自然存在的,因此具有某些特征的研究对象更倾向于进入处理组或对照组,导致不同组间存在混杂偏倚。倾向性评分法(propensity score, PS)是解决观察性研究中存在混杂偏倚的常用研究方法。该方法便于理解、研究步骤标准化程度高,近些年在非随机化大样本的观察性研究当中被广泛应用。倾向性评分法的应用主要包括匹配法、分层法和回归校正法等,以匹配法最具优势,应用范围也最为广泛。倾向性评分匹配法主要包括最邻近匹配法、卡钳匹配法和马氏距离匹配法等几种方法。目前,对于倾向性评分匹配法的应用上还有一些问题尚未得到解决。例如,对于在倾向性评分模型中应放入何种类型的协变量,目前仍存在着争议;何种匹配方法更具优势目前尚未得到定论;另外,目前倾向性评分匹配法主要用于分组因素为二分类的观察性研究资料,很少有研究将其用于分组因素为多分类的观察性研究资料中。研究目的:构建分组因素为有序三分类的倾向性评分匹配方法。通过模拟研究筛选纳入到倾向性评分模型中的协变量,比较多种匹配方法在分组因素为有序三分类情况下优劣,通过调整参数确定不同数据特征下最具优势的匹配方式,同时在分组因素为有序三分类的情况下对不同倾向性评分应用方法进行比较,最后将模拟研究中建立的最优倾向性评分匹配方法应用到实际数据分析中。研究方法:本研究采用蒙特卡洛法模拟数据集。分组因素模拟为有序三分类,并分别调整不同组间的样本量比例为1:1:1、2:3:5、1:2:3和1:4:5。根据协变量与分组因素和结局的关系模拟不同类型的协变量,包括与分组因素和结局均相关联的协变量、与分组因素相关联的协变量、与结局相关联的协变量和与分组因素和结局均不相关联的协变量。通过在倾向性评分模型中纳入不同类型的协变量,确定在分组因素为有序三分类情况下倾向性评分模型中应纳入的协变量类型。根据分组因素为二分类的倾向性评分匹配方法的基本思想,构建分组因素为有序三分类的倾向性评分匹配法,包括最邻近匹配法、卡钳匹配法和马氏距离匹配法,并通过SAS宏程序实现各种匹配方法。在不同匹配方法中设定不同匹配参数,如匹配比例、卡钳值等,通过比较不同匹配方法和设定不同匹配参数确定不同数据特征下最具优势的匹配方式。另外,还将利用模拟数据比较不同倾向性评分应用方法,包括匹配法、分层法、回归校正法和匹配后回归校正法。采用有序logistic回归分析法计算分组因素为有序三分类的研究对象的倾向性评分值。在倾向性评分匹配前后需要对放入倾向性评分模型中的协变量进行均衡性检验。本研究采用标准化差异法(standardized differences, SD)来评价不同组间协变量的均衡性。通过预实验得到,当分组因素为有序三分类时,不同组间标准化差异的绝对值的最大值大于0.1时,三组间的协变量尚未达到均衡。当完成倾向性评分匹配后,还要对模型的偏性和精度进行评价。本研究采用相对偏倚(relative bias, RB)来评价模型的偏性,RB的绝对值越小,表明模型的偏性就越小;采用平均误差均方(mean squarederror, MSE)来评价模型的精度,MSE越小,表明模型的精度越高。最后,将模拟研究建立的分组因素为有序三分类的倾向性评分匹配方法应用到实例分析中。实例分析部分的数据来源于第二军医大学承担的“中国大陆胃肠道疾病流行病学调查”的数据。本研究利用问卷中调查对象的一般信息、体格检查问卷和SF-36健康调查问卷中的数据,评价腹部肥胖与健康相关的生活质量(health-related quality oflife, HRQOL)之间的关系。人口学信息包括性别、年龄、身高、体重、教育水平、职业和慢性病发病情况等。腹部特征定义为“正常腰围”、“轻度腹部肥胖”和“重度腹部肥胖”三类。健康相关的生活质量采用中文版的健康测量简表(SF-36)进行评价。以腹部特征为分组因素,健康相关的生活质量的各个维度得分为结局,筛选人口学信息中的变量为协变量,构建倾向性评分模型。利用模拟研究建立的倾向性评分匹配方法控制混杂因素对结局的影响,从而评价腹部肥胖对健康相关的生活质量的影响。研究结果:(1)协变量筛选:在分组因素为有序三分类的情况下,当倾向性评分模型中纳入与结局相关联的协变量时,可获得相对较高的匹配比例,并且估计的处理效应的偏性相对最小,精度最高。当逐步从模型中剔除一个协变量后,如果该协变量与分组因素和结局变量均相关联,会极大增加处理效应估计值的偏性,降低其精度,说明与分组因素和结局变量均相关联的协变量需全部纳入,同时再纳入与结局相关联但与分组因素不相关联的协变量可进一步减小处理效应估计的偏性,增大处理效应估计的精度。因此,在分组因素为有序三分类的情况下,倾向性评分模型中需纳入与结局相关联的协变量,无论其是否与分组因素相关联。(2)匹配方法构建和比较:本研究构建了分组因素为有序三分类的倾向性评分匹配方法,包括最邻近匹配法、卡钳匹配法和马氏距离法,并对不同匹配方法进行比较。在不同组间样本量比例下,卡钳匹配法的效果均达到最好。当组间样本量比例为1:1:1时,采用卡钳匹配法(卡钳值设为0.005)进行1:1:1匹配效果最好;当组间样本量比例为2:3:5时,采用卡钳匹配法(卡钳值设为0.01)进行1:1:1匹配效果最好;当组间样本量比例为1:2:3时,采用卡钳匹配法(卡钳值设为0.01)进行1:1:1匹配效果最好;组间样本量比例为1:4:5时,采用卡钳匹配法(卡钳值设为0.01)进行1:2:2匹配效果最好。(3)不同倾向性评分应用方法比较:不同倾向性评分方法均能极大地降低处理效应估计值的偏性,提高处理效应估计值的精度。无论组间样本量比例如何,匹配法和匹配后回归校正法的效果均优于其他方法。当组间样本量比例为1:1:1时,回归校正法优于分层法;当组间样本量的比例逐渐拉大时,分层法优于回归校正法。(4)实例研究:经倾向性评分匹配后,所有与结局相关联的协变量均在不同腹部特征组间达到了均衡,因此可以直接评价腹部肥胖对健康相关的生活质量的作用。结果表明,在体能维度上,重度腹部肥胖组的人群得分均显著低与正常腰围组,而轻度腹部肥胖组的人群得分显著高于正常腰围组。而在社会功能维度上,只有重度腹部肥胖组的人群在得分上显著低于正常腰围组人群,轻度腹部肥胖组人群与正常腰围组人群在得分上无统计学差别。研究结论:在分组因素为有序三分类的情况下,倾向性评分模型中应纳入与结局相关联的协变量。在进行倾向性评分匹配时,采用卡钳匹配法进行匹配效果最好,卡钳值和匹配比例根据组间样本量比例进行调整。在不同倾向性评分应用方法中,以匹配法和匹配后回归校正法的效果最好。与传统多因素统计方法相比,本研究建立的分组因素为有序三分类的倾向性评分匹配方法可通过控制混杂因素定量评价不同组间连续型结局变量的差异。
其他文献
随着经济和社会发展,对职业技术人才语言交际能力要求的逐步提高,高职英语作为语言基础教育内容之一,变得越来越重要。目前,在高职英语教学过程中,如何改变"哑巴式"英语教学
英语是我国学生接触的第一门外语,这也决定了英语在我国教育体系中占有的重要地位。应用语言学是英语教学中的一部分,应用语言学能够让学生比较全面地认识英语、学习英语,让
围绕政府间财政事权和支出责任划分理论框架,以上海为研究样本,评估市区财政事权和支出责任划分效应。研究发现,相对于名义支出比重,2007—2016年,市级实际平均承担了43.85%
[阅读提示]$$“小康不小康,厕所算一桩。”$$无论是身在本地的日常工作、生活,还是身在外地旅游、出差,能否及时、方便地“方便”,是每个人都会遇到的问题。因此,公共厕所建得如何,是
报纸
写作在高中英语教学中占有重要地位。现行的写作教学模式普遍以教师为中心,重结果、轻过程,评价方式单一。该教学方式往往耗时耗力,却收效甚微。合作学习以学生为中心,看重学
文章从教学观念、教学方法和教学策略三方面来分析目前高中英语词汇教学中存在的问题,并提出了相应的词汇有效教学策略,旨在提升词汇教学效率,加强学生语言学习和运用能力。