【摘 要】
:
微阵列技术的发展为生物学研究领域提供了大量的基因表达数据,为基因功能研究提供了一种强有力的工具,使得同时分析成千上万个基因成为可能。癌症的分类以及与癌症相关的关键基
论文部分内容阅读
微阵列技术的发展为生物学研究领域提供了大量的基因表达数据,为基因功能研究提供了一种强有力的工具,使得同时分析成千上万个基因成为可能。癌症的分类以及与癌症相关的关键基因的识别已经成为当前癌症研究中的重要组成部分。由于微阵列数据维数高、样本数少的特点,普通的数据挖掘方法并不能取得很好的效果。本文主要针对微阵列数据特征选取方法和分类算法进行了深入的分析与探讨,并提出了改进的特征选择方法和癌症分类算法,以提高分类准确率和数据泛化能力。主要工作概括如下:针对特征基因选择问题,提出了一种基于相关性特征选择的分层抽样基因选择方法(CFS-SS)。由于微阵列数据具有高维度、样本少、多噪声的特点,对基因表达数据进行预处理。首先对微阵列数据进行缺失值补齐,归一化等操作。其次删除各样本基因方差值过小对分类意义不大的基因,降低维度,降低时间复杂度。然后应用相关性特征选择选择出具有局部最大相关性特征集,在其所有非空特征子集上进行分层抽样,在抽样后的特征集上进行分类性能测试,找到分类准确率最高的特征子集。在三个基因表达数据集上进行仿真实验,该方法能有效提升分类准确率。由CFS-SS提取出的特征子集作为具有差异的训练样本对基分类器进行训练,由具有差异的基分类器进行相对多数投票集成,得到一种集成分类方法(Bag-CFS-SS)。在基因表达数据集上进行实验,验证该方法的可行性和可靠性。
其他文献
新时期的中国,是一个经济跟综合实力都在不断增强的大国。随着新时期的快速推进,我国的经济高速增长,这就给我国的很多建筑工程也带来了发展的新机遇,人们的生活水平不断提高
β干扰素是一类属于Ⅰ型干扰素的重要细胞因子,具有抗病毒、抗肿瘤和免疫调节等多重活性。目前β干扰素主要应用于多发性硬化的临床治疗,是FDA批准的用于多发性硬化治疗的唯
钻孔灌注桩是桥梁基础最常见的型式之一,冲击成孔及灌注水下混凝土也是桥梁施工中易发生事故的环节,本文介绍了钻孔桩施工中易发生事故的原因及预防、处理措施。
目的:探讨联合测定血清糖蛋白抗原199(CA199)、神经节苷酯抗原50(CA50)、癌胚抗原(CEA)及甲种胎儿球蛋白(AFP)对原发性肝癌诊断的临床意义。方法:采用化学免疫发光法测定了30例原
民以食为天,自古皆然,吃永远都排在人的生存或本能需求的首位。任何人,不论国家民族,无论贵贱高低,对食欲的追求都没有什么不同。
伴随着社会的不断发展,新媒体逐渐覆盖人们的生活,而传统的纸质媒体也受到了很大的冲击。从发展历史来看,新媒体的发展离不开纸质媒体的基础,因此其未来的发展趋势也应该成为
探讨了烟厂花园改造设计的原则、设计指导思想、设计内容以及改造的效益分析。
“修辞”一词最早出现在《易经》:“修辞立其诚”。“修辞”在现代汉语词典中被解释为:修饰文字词句,运用各种表现方式,使语言表达得准确、鲜明而生动有力。“修”是修饰的意
<正>从1867年我国在学校课程中开设了"绘画课"之后,我国就正式的有了"美术教育"这一名词。1949年中华人民共和国成立后,于1956年9月教育部颁发了《初级中学图画教学大纲(草案
脑肿瘤是指发生于颅腔内的神经系统肿瘤,包括原发性肿瘤和继发性肿瘤两类。原发性脑肿瘤是指发生于颅内脑组织、脑神经、脑膜、垂体以及胚胎残余组织等的肿瘤;继发性脑肿瘤是