小样本临床数据分类问题的研究与应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：zhouheng19850

【摘要】

：

【作者】

：

康越

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2019年5期

【关键词】

：

小样本

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

临床数据中蕴含着许多有价值的信息，对于医生明确诊断，治疗疾病具有重要意义。但是现实生活中的临床数据由于保密性、不完整性，罕见疾病样本数量少，以及对于一些诊断困难疾病的临床数据类别标签获取困难等客观原因导致无法获得大量的临床样本。由这些原因造成的临床数据分类问题是一个典型的小样本数据分类问题。但是小样本临床数据采用传统分类算法训练的分类模型分类性能较低，不能满足现实生活的需要。为了进一步提高分类性能，为临床诊断提供一种有效的辅助诊断手段，本论文以临床数据为基础，针对不同疾病的小样本临床数据进行了研究，提出了数据扩增协同分类的小样本临床数据分类方法。本论文主要取得了如下成果：
　　1.从临床数据样本量少出发，为了能够获得大量的样本，提出了基于高斯混合模型的数据扩增方法。通过对已有临床数据高斯混合分布的估计生成大量带有类别标签的虚拟数据即扩增数据，这样可以为接下来的分类任务提供大量的数据支持。
　　2.本文在“数据扩增协同分类”思想下提出了两种分类算法：第一种是基于数据扩增的分类算法：对临床训练数据通过数据扩增生成大量扩增数据，然后将扩增数据和临床训练数据组成新的训练集训练传统的有监督分类模型。第二种是数据扩增协同半监督循环随机森林(DA-SSCRF)分类算法：通过对第一种算法的理论及实验分析发现数据扩增给出的类别标签存在错误会导致分类性能下降。因此为了给扩增数据标记可信度高的类别标签，本文引入了半监督学习思想，将临床训练数据作为有标签数据，对临床训练数据扩增得到的扩增数据作为无标签数据，最终提出了小样本分类背景下的半监督循环随机森林分类算法。通过构造半监督分类模型，使得扩增数据能够起到强化分类性能的作用。
　　3.通过八种疾病临床数据集的验证，DA-SSCRF分类算法的分类准确率比不进行数据扩增的有监督分类算法和进行数据扩增的其它半监督分类算法的准确率提升了3%到11%。
　　4.为了证明DA-SSCRF算法的实用性，将DA-SSCRF算法应用到了来自某三甲医院的脑膜炎疾病临床数据集上。本文通过基于变异系数的特征选择方法从原始的52维临床信息中选出了10维特征组成脑膜炎临床数据集，实验结果也表明DA-SSCRF算法在脑膜炎疾病类型的诊断准确率上提升3%，在临床医生诊断困难的结核性脑膜炎和隐球菌脑膜炎这两种类型的诊断率上分别提升了6%和10%。DA-SSCRF算法通过10维脑膜炎临床信息就能够实现对脑膜炎快速高效的诊断，对于脑膜炎疾病类型诊断具有重要意义。
　　综上，本文针对小样本临床数据的分类问题提出了相应的解决办法，有效提高了疾病诊断的准确性，对于辅助医生进行疾病诊断具有重要意义。

其他文献

CREB--CYP11B2信号通路介导的应激性高血压发病及其缓压乐复方制剂干预作用机制研究

目的:探讨血管紧张素Ⅱ-CaMK-CREB-CYP11B2和肾上腺素-PKA-CREB-CYP11B2途径在应激性高血压发病中的作用及缓压乐复方制剂干预作用机制。方法:(1)领取6-8W鼠龄的雄性SPF级70只Wistar大鼠，适应性喂养7d后，按照随机方法分为正常组、SIH模型组、药物干预组(缓压乐复方制剂)和阴性对照组(蒸馏水)。除正常组外其余三组大鼠给予复合应激刺激(间断足底电刺激及声、光刺

学位

高血压

木质纤维生物质酸碱催化水热预处理及酶解的研究

目的:水热预处理是促进木质纤维生物质酶解的有效方法,针对高温水热预处理能耗高、脱木质素低等不足,本论文目标是系统研究酸、碱催化剂对中温水热预处理的影响,考察过程组分结构变化,分析影响酶解效率的关键因素,在降低能耗的同时,建立高效酸/碱催化水热预处理过程,增强预处理-酶解过程可发酵糖回收,为木质纤维生物质高效转化生物燃料奠定基础。方法:为增强预处理-酶解过程可发酵糖回收,首先研究酸催化水热预处理(A

学位

木质纤维生物质

下肢静脉曲张微创手术并发症的防治经验

下肢静脉曲张是血管外科的常见病和多发病,下肢静脉曲张微创手术因创伤小、并发症少而被广泛接受,但仍存在一定程度的手术并发症风险。本文将下肢静脉曲张微创手术常见并发症的预防及治疗进行总结,以期提高静脉曲张微创手术的质量,减少并发症的发生。

期刊

下肢静脉曲张血管外科微创手术大隐静脉浅静脉血栓并发症髂静脉皮肤硬结曲张静脉深静脉血栓形成

结构阅读与小说教学——以人教版高中语文教材为例

阅读教学一直都是语文教育最重要的内容之一,深入而富有成效的小说阅读教学不仅能加强语文课程与教学的文化色彩,也可以塑造学生的语文核心素养。学生在阅读中自主感悟,激发起创新思维、思辨能力等,也能良好作用于其他方面,如听、说、读、写能力的提升。但小说阅读教学的现状却不容乐观,尤其在高中阶段,许多篇目的小说阅读流于表面,没有发挥出古今中外文学精粹立德育人的良好效果。经过调查分析,主要原因有三:教学过程中没

学位

阅读教学高中语文教学结构阅读小说教学教学实践叙事学思辨能力高中语文阅读理论文学理论

基于阻抗模型的柔性直流输电系统稳定性分析与控制方法研究

学位

农村幼儿教师的专业素养现状调查及对策——以赣州市为例

“百年大计,教育为本。”学前教育是国民教育的起点,在整个教育过程中起奠基作用。《国家中长期教育改革和发展规划纲要(2010-2020年)》的推行,进一步普及了学前教育,也壮大了幼儿教师的队伍。但农村学前教育一直是学前教育的短板,如何打造一支师德高尚、知识扎实、技能过硬的高素养农村幼儿教师队伍是人们关注的焦点。本研究基于《幼儿园教师专业标准(试行)》的背景之下,旨在分析赣州市农村幼儿教师的专业素养现

学位

幼儿教师

小样本临床数据分类问题的研究与应用

其他学术论文