论文部分内容阅读
[研究背景]2型糖尿病(Type 2 diabetesmellitus,T2DM)是我国常见的慢性病,近年来其患病率不断上升,造成了严重的疾病负担。随机对照试验(Randomized controlled trials,RCT)作为循证医学的最佳证据,已经证实生活方式干预(包括戒烟、限酒、运动、饮食和体重管理等)及降糖药物干预(如二甲双胍等),可以有效控制血糖水平。所以,糖尿病防治指南也已将其纳入作为常规干预措施。然而,在真实世界社区人群中,通过推行指南落实这些干预措施时,却发现其干预效果并不理想。这可能是由于“脱离RCT严格纳入、排除标准所选择的同质患者试验对象”的真实世界社区糖尿病患病人群中,患者的异质性程度高、病情复杂多样、依从性差、综合干预措施落实不到位等原因,影响了药物干预和生活方式干预的效果。因此,在真实世界社区背景下,针对患者的实际情况进一步系统、客观地评价生活方式及药物干预对于血糖控制的有效性,探究干预依从性对于干预效果的影响,对于优化干预措施、筛选糖尿病干预基本药物,指导社区糖尿病干预措施和政策优化,具有重要的公共卫生学意义。此外,由RCT得出的疗效评价结果,主要关注平均处理效应(Average treatment effect,ATE),即评价受试人群在平均水平上能否从干预中获益。然而,在糖尿病防治实践中,医生面对的却是具有高度异质性的个体病例,更需要针对个体特征选择适宜的个性化干预方案。真实世界社区试验覆盖更广泛的患病人群,且患者根据实际病情和自身意愿非随机地选择干预措施,为个性化疗效(Individualtreatmenteffect,ITE)评价提供了有效信息。因此,在真实世界社区人群背景下,如何在评价平均处理效应(ATE)的基础上进一步评估个性化疗效(ITE),进而根据患者个性化特征指导其个性化干预方案制定,值得我们更深入的探索和研究。目前,利用真实世界的观察性、非随机化研究,模拟随机对照试验设计,并进行干预效果评价和因果推断的方法逐渐受到重视。此外,针对真实世界研究的个性化效应评价方法发展迅速。其中,uplift模型是一种基于机器学习理论的净效应值估计方法,该模型可以在个体水平上估计处理组和对照组的有效概率的差值,即净效应,从而实现了个体收益的评价,并能有效识别出受益个体。因此,探讨该模型在真实世界社区试验个性化疗效评价中的应用,将有助于糖尿病个性化干预方案制定和优化。[研究目的]本研究依托山东胶南慢性病综合防治干预项目中的2型糖尿病队列,设计2型糖尿病真实世界社区试验,主要研究目的如下:1.评价以真实世界社区为基础的2型糖尿病综合干预措施(生活方式+药物干预)对于控制患者空腹血糖水平的有效性;探究降糖药物的使用和药物依从性对干预效果的影响,为进一步完善社区干预方案提供依据。2.通过实证研究,探索基于真实世界社区试验,通过倾向性评分匹配等策略设计模拟随机对照试验的可行性、科学性和有效性,为真实世界社区干预试验的研究方法提供借鉴。3.基于模拟随机对照试验,评价降糖药物的平均处理效应(ATE),进而利用uplift模型评价个性化疗效(ITE)并识别受益个体及其特征;并探索uplift模型在评价个性化疗效和指导个性化用药方面的应用价值。[研究方法]1.研究设计及数据来源:山东胶南慢性病综合防治干预项目由胶南市卫生局主导实施,山东大学负责技术评价,正式实施期为2012年1月1日至2015年12月31日。本研究基于其中的2型糖尿病队列,设计2型糖尿病真实世界社区试验,并获取基线、干预过程和干预结局信息。其中,基线测量包括人口学特征、体格和实验室检查、生活方式,病史相关信息等;干预过程信息为生活方式和药物干预的动态变化及历次随访信息(一年至少四次随访,随访项目包括空腹血糖、血压、吸烟、饮酒、体育锻炼情况、二甲双胍和格列吡嗪等降糖药物的使用及药物依从性评估);结局信息为空腹血糖水平及其控制达标。本研究从该队列15348例糖尿病患者中,筛选出8499例患者作为研究对象,4年间总随访次数达38557次。2.基于2型糖尿病队列的综合干预效果评价:以空腹血糖测量值为评价指标,采用线性混合效应模型评价不同性别和不同用药组的血糖变化轨迹及组间差异;进而,以相邻两次随访的空腹血糖测量值之差(本次随访测量值-前次随访测量值)为评价指标,采用线性混合效应模型逐步调整混杂因素,获得相邻两次空腹血糖变化差值的估计值,采用核密度图评价不同用药组和不同依从水平组的该指标的组间差异。3.基于2型糖尿病队列的模拟随机对照试验设计:基于2型糖尿病队列每月一次的随访信息(自2012年1月至2015年12月间共48个月),设计针对不同降糖处方的模拟随机对照试验,以此进行药物干预效果评价。依据如下纳入标准选择当月的受试对象:1)当月新纳入的糖尿病病例(保证每位对象最终仅纳入一次);2)持续干预至少6个月(期间未用药,或用药并且未更换药物和用法);3)在干预期满后半年内有至少一次的空腹血糖测量记录。重复该纳入标准至48个月中的每个月,在其中36个月中挑选出了合格的受试对象(其他12个月无合格的受试对象),即构造了36次“试验”(表2-1),共纳入4226名受试对象;其中,2723例用药者作为处理组(包括二甲双胍、格列吡嗪和两者联用三种降糖处方),1503例非用药者作为对照组。两组的结局指标均为干预期满后半年内首次空腹血糖测量值。采用倾向性评分匹配法(PSM),通过logistic回归模型,以糖尿病相关混杂因素为协变量,计算每位受试对象的倾向性评分,随后在基线空腹血糖精确匹配的基础上,采用最近邻匹配按1:1的比例为处理组的每位受试对象匹配对照组的一名对照,构造匹配后的处理组和对照组,从而平衡两组间的基线差异,达到拟随机化的目的。最终,二甲双胍组及对照组各纳入832例,格列吡嗪各纳入190例,二者联用各纳入451例受试对象。4.基于模拟随机对照试验的药物干预效果评价:基于上述模拟随机对照试验,采用协方差分析进一步调整匹配变量(控制因匹配而导致的选择偏倚),比较各处方处理组和对照组干预前后血糖差值(干预后血糖-基线血糖)的组间差异,以此评价平均处理效应(ATE)。进而,以空腹血糖水平是否控制达标(≤7mmol/L)作为结局指标,采用uplift模型通过因果条件推断森林法,以欧几里得距离为分叉标准,估计个体净效应,即接受药物干预和不接受药物干预得以控制血糖达标的概率差,同时,识别各处方的受益个体及其特征,采用5折交叉验证通过Qini曲线和Qini指数评价模型的有效性和稳定性,以此评价个性化疗效(ITE)。[研究结果]1.2型糖尿病队列的描述性分析:8499名受试对象平均年龄64.88岁,37%为男性,63%为女性;59%为用药者,41%为非用药者。用药者相对于非用药者更为年轻,吸烟、饮酒率和心血管疾病患病比例较高,血糖、血压和血脂水平均较高。经4年随访干预,人群空腹血糖平均水平较基线的变化为-0.36 mmol/L[95%CI(-0.38,-0.35)],其中男性为-0.40 mmol/L[95%CI(-0.47,-0.34)],女性为-0.49 mmol/L[95%CI(-0.54,-0.43)],性别差异无统计学意义(P=0.058);按用药分组,用药者为-0.56 mmol/L[95%CI(-0.62,-0.50)],非用药者为-0.29 mmol/L[95%CI(-0.34,-0.24)],用药者的血糖平均下降大于非用药者(P<0.001)。2.基于2型糖尿病队列的综合干预效果评价:1)不同性别和不同用药组的空腹血糖平均水平随干预时间均呈现下降趋势,同一时间点上表现为男性低于女性,用药组低于非用药组,可能与基线血糖水平不同有关(图3-1);以两组基线血糖为基准标化后,血糖水平仍表现为随随访干预时间而下降。经线性混合效应模型调整协变量后发现,不同性别间血糖水平变化无差异(P=0.101),而用药和非用药组组间血糖水平变化的差异具有统计学意义(P<0.001)。其中,经协变量调整后的用药组的平均血糖水平较基线的变化值为-0.124 mmol/L[95%CI(-0.125,-0.122)],多于非用药组的-0.065 mmol/L[95%CI(-0.067,0.063)],两组相差-0.059 mmol/L[95%CI(-0.061,-0.056)]。2)经线性混合效应模型调整协变量估计相邻两次血糖测量值之差,并采用核密度估计(图3-2,3-3),结果显示用药组的相邻两次血糖下降值(中位数-0.106 mmol/L)多于非用药组(中位数-0.049 mmol/L),差异具有统计学意义(P<0.001);用药依从组(中位数-0.102mmol/L)多于不依从组(中位数-0.069 mmol/L),差异具有统计学意义(P<0.001)。3.模拟随机对照试验设计效果:倾向性评分匹配前,处理组与对照组间的年龄、性别、受教育程度、血糖、血压、血脂等指标多数具有统计学差异;经倾向性评分匹配后,上述指标在二甲双胍组及对照组、格列吡嗪组及对照组、及二者联用组及对照组间均无统计学差异(表3-5,3-6,3-7),表明拟随机化效果较佳。4.基于模拟随机对照试验的药物干预效果评价:1)评价平均处理效应(ATE)发现,二甲双胍组相较对照组,平均血糖水平下降值相差-0.04 mmol/L[95%CI(-0.09,0.16)],二甲双胍干预无效(P=0.544);评价血糖控制率发现,二甲双胍组较对照组血糖控制率升高6.97%[95%CI(2.58,11.36)],差异具有统计学意义(P=0.002)。经uplift模型评价个性化疗效(ITE)显示,60%的受试对象可从二甲双胍药物干预中受益,经5-折交叉验证所得Qini指数为0.0266大于0,表明按模型选择受试对象进行干预优于在人群中随机挑选个体进行干预。进一步识别个体特征发现,二甲双胍用药收益高者相对与收益低者更为年轻、受教育程度高、吸烟率低、基线腰围、收缩压、血脂均较低。2)格列吡嗪组相较对照组,平均血糖水平下降值相差-0.06 mmol/L[95%CI(-0.17,0.29)],血糖控制率相差1.05%[95%CI(-7.62,9.73)],平均处理效应(ATE)评价(P=0.594)及血糖控制率比较(P=0.812)均显示干预无效。而评价个性化效应(ITE)显示50%的受试对象可从格列吡嗪用药中受益,经5-折交叉验证后Qini指数为0.0213。受教育程度高、不吸烟、腰围大者更易从中获益。3)二者联用组相较对照组,平均血糖水平下降值相差0.05 mmol/L[95%CI(-0.24,0.15)],血糖控制率相差3.99%[95%CI(-1.48,9.46)],平均处理效应(ATE)评价(P=0.604)及血糖控制率比较(P=0.812)均显示干预无效。而评价个性化效应(ITE)显示40%的受试对象可从该联用处方中受益,经5-折交叉验证后Qini指数为0.0245。男性,受教育程度高,吸烟,体育锻炼多者更易从中获益。[研究结论]1.基于真实世界社区试验的2型糖尿病综合干预,包括生活方式干预和药物干预,可有效控制患者的空腹血糖水平。降糖药物的使用和良好的服药依从性有助于血糖控制。2.基于真实世界社区干预试验,通过倾向性评分匹配等策略设计的模拟随机对照试验可用于降糖药物的干预效果评价;该设计方法为真实世界社区干预试验的分析评价提供了策略。3.以二甲双胍、格列吡嗪和两者联用三种降糖处方为例进行的个性化疗效评价表明,仅采用平均处理效应(ATE)评价疗效易掩盖药物真实效应。而采用uplift模型评价个性化效应(ITE),可有效识别出受试者中的受益者比例、受益个体及有助于指导个性化用药的特征指标。