基于ELM的肿瘤基因表达数据分类算法研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:siyuezaici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着肿瘤患者的逐渐增多,预防和治疗肿瘤是全世界关注的焦点问题。据统计,全世界由于恶性肿瘤导致的疾病死亡人数已位居第一,大大超过了心脏病和脑血管病的死亡人数。目前的肿瘤诊断方法大多以形态学为基础,同一类型的肿瘤可能会出现临床上的差异,对治疗的敏感性存在很大的局限性。基因芯片技术的快速发展使得越来越多的肿瘤基因表达数据得以测定。从分子生物学角度出发,利用基因芯片技术有效地分析、处理和利用基因表达数据,进而对癌症病人进行早期诊断和个性化治疗对提高病人的生存率具有重要的意义。然而,基因表达数据具有高维、分布不平衡、样本数量少等特征,如何从高维数据中提取出少数关键的致病基因,即基因表达数据的分类,引起国内外学者的广泛关注。本文聚焦肿瘤基因表达数据的分类问题研究,借助于神经网络和极限学习机(Extreme Learning Machine, ELM)等理论方法和工具构建分类模型,设计和实现基因表达数据分类算法。首先,针对单个ELM性能不稳定问题,采用了一种基于输出不一致测度的ELM相异性集成算法进行分类器集成。以输出不一致测度为标准判断不同ELM模型之间的相异性,根据ELM的平均分类精度对ELM模型进行筛选,并采用多数投票法对筛选后的分类模型进行集成。然后,分析了拒识代价和误分类代价对基因分类性能的影响,进而以减少决策风险、降低平均代价为目标,设计了代价敏感的ELM算法。通过在算法中引入代价敏感因素,极大地改进了ELM处理不同代价基因表达数据的有效性。以多种肿瘤数据集为参考,本文对采用的算法进行了理论分析和实验验证,结果表明:ELM相异性集成算法能以更少的模型数量达到较稳定的分类精度;代价敏感的ELM算法能有效降低平均误分类代价,提高分类可靠性。因此,本文的研究工作有助于提高肿瘤基因表达数据的分类精度,在一定程度上解决了该研究领域的难点问题,对于推进高维、不平衡基因表达数据的研究具有重要的理论意义和实用价值。
其他文献
胸腺瘤(thymoma)是常见的前纵隔原发性肿瘤,约占前纵隔肿瘤的50%,人群中总发病率为0.0015‰。由于胸腺瘤是一种罕见而独特的肿瘤,具有悠久的自然历史,增加了其研究难度。目前
目的:研究盐酸普鲁卡因对人急性髓系白血病(AML)细胞株HL-60细胞DNA结合抑制因子4(ID4)基因甲基化状态及细胞增殖的影响,探寻白血病基因治疗的潜在靶点。方法:体外培养人AML
综述和讨论了芳香族磷酸酯阻燃聚碳酸酯(PC)/丙烯腈-丁二烯-苯乙烯共聚物、硅化合物和硫化合物阻燃 PC 的阻燃机理以及 PC 的热分解机理。涉及的反应有碳酸酯基的重排、羟基
目的对45例小细胞肺癌(SCLC)肿瘤组织和20例癌旁正常肺组织进行免疫组化实验,检测组织中相关血管信号因子如血管内皮生长因子(VEGF)、DLL4及Notch1的表达情况并进行比较,从而
目的:分析比较手术联合化疗与放疗联合化疗在局限期小细胞肺癌治疗中的预后及探讨影响预后的相关因素。方法:回顾性分析2007年1月至2012年1月于河北医科大学第四医院治疗的局
随着互联网技术的突飞猛进,"互联网+"成为当下各行各业繁荣发展的最新驱动力,尤其是对文化产业的创新和变革作用最为明显。区域文化产业面临新的机遇和挑战。潍坊风筝文化源
目的:通过流式细胞术分别对经腹腔镜和开腹下行胃癌D2根治术患者的腹腔冲洗液中的肿瘤脱落细胞进行检测,对比分析两组肿瘤脱落细胞阳性检测率,为日后临床工作中对胃癌患者手
目的研究丝裂原活化蛋白激酶/细胞外信号调节激酶(mitogen-activated protein kinase/extracellular signal-regulated kinase,MAPK/ERK)通路抑制剂PD98059对卵巢癌SKOV3和OV
采用二项Logistic回归分析法,通过分析2011年中国健康与养老追踪调查数据,探究城乡老年人社区参与的影响因素。研究发现,人口学和社会经济地位变量(如教育程度、婚姻状况、户
在《月亮与六便士》中,毛姆采用的一系列叙事策略是其中独特的亮点。本文将通过文献分析法,采用热奈特的叙事理论,研究《月亮与六便士》的叙述者及其层次和反讽叙事。由于在