基于乙肝患者生化信息的肝纤维化无创预测模型构建及其可视化

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:niko_robin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:本研究旨在确定合理的降维和变量筛选方法来选择合适的预测因子,利用现有的已接受肝穿刺活体组织检查术的乙肝患者的血清生化水平指标,建立无创慢性乙肝患者肝纤维化的预测模型,并实现模型的可视化,用以筛选需要进行肝穿确诊的人群,或者实现患者自检,提早筛查的功能,从而达到降低成本,增加经济效益,更好地支持临床决策和诊治的目的。方法:本研究的研究对象为2009年至2014年于中国医科大学附属盛京医院采集的共计1224例的全部肝病门诊患者,经过纳入和排除标准的筛选,867例乙肝患者纳入研究。采用频数及构成比来描述离散型变量的情况,中位数和上下四分位数来描述连续型变量的情况。随后将数据按照7:3分为两组,分别用于模型构建和外部测试,建模组数据经过LASSO(Least absolute shrinkage and selection operator)降维和随机森林两种变量筛选方法综合筛选模型的预测因子,确定候选变量。筛选后的变量经过决策树分箱后纳入到模型中,利用Logistic回归拟合模型,得出各预测变量指标模型系数。利用校正曲线和受试者工作曲线及曲线下面积进行模型预测能力的评定,利用决策曲线判对模型的最终收益进行评定,最终实现模型的可视化。结果:经过基本情况描述单变量分析,保留21个预测因子。867例患者按照7:3的比例分成建模组和验证组,两组间差异无统计学意义,均衡可比。随后对建模组内数据进行降维和变量筛选,其中LASSO降维分析排除6个变量,而随机森林分析剔除7个变量,综合二者变量选择排除10个预测因子,保留TT、APOB、DD、CHOL、AST、ALPK、APTT、TBA、GGT、PLT、AFP这11个随后用于模型构建的预测因子。单变量决策树分箱将这11个变量离散化,其中4个转化成二分类指标,5个转化成三分类指标,2个转化成四分类指标。分箱后的变量作为解释变量,二分类的肝穿结局变量作为因变量,建立Logistic回归,最终7个变量纳入模型中,其中APOB和PLT可以解释为肝纤维化的保护因素,而其他的5个变量AFP、GGT、TBA、APTT、TT可以认为是肝纤维化的危险因素。对模型单变量拟合的检验发现,模型整体拟合良好,没有变量出现过度拟合状况。另外,建模组和校正组校正曲线显示预测与实际情况贴合紧密,预测符合实际。而在受试者工作曲线中,建模组曲线下面积为0.834(0.802-0.862),验证组曲线下面积为0.818(0.765-0.863),两组面积均超过0.8,模型预测准确度高。而决策曲线结果显示模型收益高于现有的几个简单纤维化诊断模型。结论:本研究中LASSO降维和随机森林联合筛选11个候选变量,决策树分箱将他们离散化,而最终模型提示载脂蛋白B(APOB)和血小板计数(PLT)是纤维化的保护因素,γ-谷氨酸转肽酶(GGT)、血清总胆汁酸(TBA)、甲胎蛋白(AFP)、活化部分凝血酶时间(APTT)和凝血酶凝结时间(TT)是纤维化的危险因素。模型整体表现优异,ROC曲线下面积分别是0.834和0.818,准确度和综合效益均高于一般模型,转化后的诺谟图更加直观和快捷,值得广泛推广,同时也可以给其他的纤维化研究提供依据。
其他文献
目的:分析急性重症胰腺炎(SAP)与非重症急性胰腺炎患者临床资料及血浆中性粒细胞胞外陷阱(NETs)水平的差异,探讨其临床意义。方法:选择2019年1月至2019年11月就诊于我院急诊
齿辊是磨粉机的重要部件,对面粉品质影响及设备性能起决定性作用。齿辊在研磨物料过程中伴随着辊面磨损,使齿辊表面几何特性产生变化,对能耗、研磨效果和齿辊寿命等相关参数
由中、低等毒力猪瘟毒株引起的非典型猪瘟目前正危害着我国养猪业发展,感染猪很难通过临床症状或普通血清学方法与猪瘟弱毒疫苗免疫猪进行区分,给猪瘟的净化造成了很大困难。
近年来,燃料电池作为新能源体系的代表,由于其安全性、绿色型、高效性、燃料多样性等特点,发展迅速,备受关注。在几类燃料电池中,质子交换膜燃料电池(Proton Exchange Membran
我国是水产养殖业最为悠久的国家之一。随着水产养殖业的发展,集约化、高密度养殖模式已经成为主要的养殖模式,而这种养殖模式造成了水体自净能力下降,水体污染严重,动物容易
目的:原发性肝癌被预测为2018年全球第六大最常被诊断癌症和全球第四大癌症死亡原因,肝细胞肝癌(hepatocellular carcinoma,HCC)被认为是原发性肝癌的最常见形式。大多数HCC
船舶及航运行业是交通运输中的重要产业,但其能耗及碳排放的增长幅度却远超其他行业水平;另一方面,集装箱船作为三大主流船型之一,所产生的CO2排放量在所有船型中占比最高,其
目的:分析2型糖尿病微血管病变与血清CYFRA21-1、CA199、CEA指标的相关性。方法:选取符合纳入标准的2017-2018年我院内分泌科单纯2型糖尿病患者(2型糖尿病无微血管病变)60例,
目的:探讨大脑半球次全切除术治疗运动功能存留的半球癫痫综合征。方法:回顾性分析2010年至2017年中国人民解放军第174医院行大脑半球次全切除术的19例半球癫痫综合征患者。
近年来人类的科技水平飞速发展使得能源需求量日益增长。而陆地石油储藏量在多年的开采下越发稀少,开发利用深海石油资源显得更为重要。海洋立管作为连接海底资源与海上作业