基于层次分类法的弥漫大B细胞淋巴瘤疾病进展阶段多分类预测研究

来源 :山西医科大学 | 被引量 : 0次 | 上传用户:yxzapricot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:弥漫大B细胞淋巴瘤(DLBCL)是非霍奇金淋巴瘤中最常见的亚型,目前R-CHOP(利妥昔单抗+环磷酰胺、阿霉素、长春新碱和强的松)方案作为DLBCL的化疗首选,大部分患者可以达到完全缓解。但仍有部分患者在治疗中病情进展或缓解后早期复发(缓解期小于一年),且复发后一线标准治疗的反应率较低,反应连续作用时间较短,最终转变为难治性DLBCL,成为DLBCL主要死亡原因。针对这一问题,本研究欲构建DLBCL患者疾病进展阶段的多分类预测模型,以达到辅助临床工作者诊断疾病进展阶段及在后期巩固治疗中合理选择治疗方案的目的。方法:1.模拟研究:使用SOMTE、Borderline-SMOTE、ADASYN三种类别平衡方法分别平衡5个不平衡率各异的公共数据库后,使用BP神经网络、支持向量机、随机森林3种机器学习方法及各自的Adaboost集成共6种算法构建直接多分类模型,ROC曲线下面积、F值、G-means等指标多适用于二分类问题,故选取分类准确率作为直接多分类的评价指标。采用层次分类法构建间接多分类模型,将上述6种算法作为备选基分类器,应用分级度量方法,以每层分类器的准确率、灵敏度、F值、ROC曲线下面积(AUC)和G-means值作为评价指标,筛选出各层级的最优模型后,应用层次度量法计算出层次式准确率,与直接多分类模型的分类准确率进行对比。2.DLBCL实例应用:收集DLBCL患者的一般情况、病理信息、PET-CT/CT影像数据与治疗方案等100余个特征,应用基于单特征相关性排序法、递归特征消除法和随机森林3种特征选择方法筛选出不同的特征子集后,选取模拟研究中性能最优的类别平衡方法与多分类方法构建DLBCL患者疾病进展阶段多分类预测模型,比较3种特征选择方法筛选出的特征子集对多分类模型性能的影响。结果:1.模拟研究:(1)balance数据库:直接分类法中,支持向量机应用Borderline-SMOTE进行类别平衡的性能最优(准确率=0.7440);支持向量机Adaboost集成应用ADASYN进行类别平衡的性能最优(准确率=0.7909);BP神经网络应用ADASYN进行类别平衡的性能最优(准确率=0.7740);BP神经网络Adaboost集成应用ADASYN进行类别平衡的性能最优(准确率=0.7895);随机森林应用ADASYN进行类别平衡的性能最优(准确率=0.7572);随机森林Adaboost集成应用Borderline-SMOTE算法进行类别平衡的性能最优(准确率=0.7595)。由上述可知balance数据库的直接分类法中4种模型的最优建模应用了ADASYN算法,2种应用了Borderline-SMOTE算法,可得ADASYN算法类别平衡性能更优,所有模型中采用ADASYN算法的支持向量机Adaboost集成性能最优(准确率=0.7909)。层次分类法的第一层分类中,与上述直接分类法的分析过程相同,比较并选出各个基分类器中性能最优的类别平衡算法为Borderline-SMOTE算法,所有模型中采用Borderline-SMOTE算法的BP神经网络Adaboost集成性能最优(准确率=0.8788,灵敏度=0.8323,F值=0.8620,AUC=0.8749,G-means=0.8739);第二层分类中,比较并选出各个基分类器中性能最优的类别平衡算法为ADASYN算法,所有模型中采用ADASYN算法的随机森林性能最优(准确率=0.8500,灵敏度=0.8265,F值=0.8572,AUC=0.8523,G-means=0.8519);将上述两个层级中的最优基分类器结合后的层次式准确率=0.8316,高于直接分类法的最高准确率0.7909。综上所述,应用balance数据库建模,ADASYN算法和层次分类法性能最优。(2)new-thyroid数据库:同上述过程,Borderline-SMOTE算法和层次分类法性能最优。(3)hayes-roth数据库:Borderline-SMOTE算法和层次分类法性能最优。(4)contracepive数据库:ADASYN算法性能最优,其中层次分类法的层次式准确率=0.8183,直接分类法最高准确率=0.8180,前者性能略优于后者。(5)wine数据库:Borderline-SMOTE算法性能最优,层次分类法的层次式准确率=0.8186,直接分类法最高准确率=0.8172,前者性能略优于后者。2.DLBCL实例应用:采用基于单特征相关性排序法、递归特征消除法和随机森林三种特征选择方法分别筛选出10种、11种、19种特征变量,构建了3个特征子集,采用上述模拟研究中选择的最优类别平衡方法Borderline-SMOTE算法分别对其进行类别平衡,并采用层次分类法构建DLBCL疾病进展阶段多分类预测模型,其中采用基于单特征相关性排序法筛选的特征子集构建的层次分类模型的层次式准确率=0.8864;采用递归特征消除法筛选的特征子集构建的层次分类模型的层次式准确率=0.8479;采用随机森林选择的特征子集构建的层次分类模型的层次式准确率=0.9263。结论:1.经模拟研究得出Borderline-SMOTE算法和ADASYN算法的类别平衡性能均优于SMOTE算法,二者性能相差不大,本研究中Borderline-SMOTE算法略优于ADASYN算法;层次分类法整体分类性能优于直接分类法。最终选择Borderline-SMOTE类别平衡方法和层次分类法构建DLBCL疾病进展阶段多分类预测模型。2.使用基于单特征相关性排序法、递归特征消除法和随机森林三种方法对DLBCL患者的病例信息数据库进行特征选择,其中年龄、KPS得分、疾病等级、是否GCB、HBVDNA为3种方法筛选出的共同特征。本研究中采用随机森林筛选的特征子集所构建的DLBCL疾病进展阶段多分类预测模型性能最优。
其他文献
目的:通过回顾性分析研究NOSES-Ⅰ式E法与腹腔镜低位前切除术两种手术方式治疗超低位直肠癌患者的临床资料,对比两种手术方式在治疗超低位直肠癌中的疗效、安全性及卫生经济学等指标。方法:选取并收集62例于2018年6月至2020年2月在山西省肿瘤医院结直肠肛门外科进行治疗的超低位直肠癌患者,按照手术方式分为A组与B组,其中A组患者通过NOSES-Ⅰ式E法(经自然腔道取标本术联合改良Bacon术)进行
目的:比较老年MM患者不同化疗方案的疗效及安全性。方法:回顾性分析老年MM患者的临床资料,包括年龄、治疗方案、疗效、不良反应以及衰弱评分中包含的日常生活能力评分、日常生活活动能力量表及charlson合并症指数,按照评分标准将患者分为身体状态良好、欠佳及虚弱3组。统计分析不同体质状况的老年MM不同化疗方案的治疗有效率、1年总生存率及不良事件发生率。结果:70例患者中,身体状态良好、欠佳和虚弱组的治
目的:1.探究HMGB1在初诊MM患者中的诊疗及预后的作用。2.探究sRAGE在初诊MM患者中的诊疗及预后的作用。3.探究HMGB1及sRAGE两者之间的相关性及在临床中的应用价值。方法:收集2018年10月-2020年5月期间山西医科大学第二临床医学院入院确诊的50例初诊多发性骨髓瘤(MM)患者化疗前后血清标本,使用ELISA方法检测HMGB1、sRAGE含量,同时收集MM患者性别、年龄、DS分
目的:探讨AML患者应用中大剂量Ara-C方案化疗后发生医院感染的临床特点、影响因素及防治措施。方法:对2013-2020年期间就诊于山西医科大学第二医院的80例AML患者的临床资料进行筛选,这些患者均接受中大剂量Ara-C方案治疗,回顾性分析其:(1)医院感染情况;(2)年龄、AML分型、预后等级、诱导化疗期间感染、合并其他疾病、Ara-C剂量、Ara-C疗程、抗生素预防、化疗前血常规对患者发生
目的:探究KLF4对骨肉瘤生物学功能及肺转移的影响及其可能机制。方法:(1)人种属骨肉瘤细胞系(Saos-2、U2OS)和成骨细胞系(hFOB)中KLF4的表达量分别被Western-Blot、qRT-PCR检测。本院骨肉瘤临床病理切片及正常骨组织的KLF4表达差异通过IHC验证。(2)慢病毒转染人骨肉瘤Saos-2细胞,构建KLF4低表达细胞系KLF4-DOWN,作为实验组;不携带目的基因的阴性
目的:对S100A9蛋白在胃癌组织中的表达及其在胃癌患者不同病理特征状态下的相关性及其意义进行系统评价。方法:用计算机检索Cochrane Library、Web of Science、Ovid、Springer Link、PubMed、中国知网、万方、维普等数据库建库至2021年2月1日前公开发表的关于胃癌组织中S100A9蛋白的表达及其意义的研究,设定合适的纳入标准和排除标准,由2名研究者各自
目的:研究修正的供者淋巴细胞输注(MDLI)在不进行异基因造血干细胞移植(Allo-HSCT)的情况下治疗中高危血液系统恶性肿瘤(HMs)的临床疗效和安全性。方法:对山西医科大学第二医院从2014年5月到2018年8月的16例接受MDLI恶性血液病患者的病例资料进行回顾性研究。16例患者均在完成了标准剂量的化疗后开始进行MDLI过继性细胞免疫治疗。主要观察指标是MDLI后患者的CR率、造血重建时间
目的:通过比较食管空肠π形吻合术与overlap吻合术临床疗效的差异,以探究全腹腔镜全胃切除术消化道重建中π形吻合法的临床价值。方法:回顾性分析2017年1月—2019年5月在山西省肿瘤医院接受完全腹腔镜全胃切除术的局部进展期胃上部癌患者的临床资料,分为π形吻合组和overlap吻合组,比较两组患者手术情况、术后恢复情况、术后并发症情况。结果:符合纳入排除标准的患者共99例,其中50例行食管空肠π
研究目的:阐明在胰腺癌细胞中,miR-1291可能作用的分子通路及其对细胞凋亡的影响,研究miR-1291在胰腺癌发生发展机制,以便为临床胰腺癌的早期诊断及基因靶向治疗提供新的方向。研究方法:本研究通过q RT-PCR验证miR-1291在胰腺导管上皮细胞(HPDE6-C7)及胰腺癌细胞(PANC-1)内表达情况;通过使用lipo 3000体外转染将miR-1291模拟物(miR-1291 mim
目的:探讨细胞凋亡易感蛋白(CAS)在急性白血病患者骨髓组织中的表达情况,并分析其与患者外周血WBC、PLT、骨髓原始细胞比例、ki-67指数、分子生物学和细胞遗传学预后危险度分层、首次化疗缓解情况等临床特征的关系。方法:收集2018年6月-2019年9月在山西医科大学第二医院初次确诊急性白血病患者91例作为病例组,其中急性髓系白血病(AML)54例,急性淋巴细胞白血病(ALL)37例;选取同期入