基于神经网络的多类肿瘤亚型识别研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wangzhaolinghappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于基因表达谱建立具有有效预测性的肿瘤分类模型对肿瘤的临床诊断与治疗具有非常重要的意义。针对肿瘤亚型识别问题,所要解决的一个关键问题就是发现决定肿瘤亚型的一组特征基因子集。本文以急性淋巴性白血病(ALL)的七种亚型作为研究对象,从系统科学和信息科学的角度,采用人工智能和计算机技术,就急性淋巴性白血病的特征基因选取问题和亚型识别问题,基于基因表达数据进行了研究,取得如下研究成果:首先针对ALL亚型分类信息的分类权重的研究,本文采用Relief算法作为对ALL亚型进行特征基因选取的距离指标,用以剔除分类无关基因。考虑到ALL具有七个亚型,我们使用改进的Relief_F算法作为基因排序和选择的标准。其次针对ALL亚型预测模型的研究,本文分析了基于人工神经网络(ANN)的分类工具在急性淋巴性白血病肿瘤亚型识别中的应用。介绍了人工神经网络的特点及其在模式分类中的应用,同时我们设计了一个三层的BP网络模型,其隐含层节点数可以随着输入特征基因数的变化而变化。通过留一交叉检验与独立测试集评估,选取了一个包含169个基因的特征集合,以此作为BP网络模型的分类输入特征,获得了100%的分类准确率。最后针对ALL样本集中冗余基因过滤问题,提出一种基于基因表达谱聚类分析方法寻找癌症相关靶基因和共调控基因的方法,介绍了K-means聚类方法以研究特征基因集合的聚类性能,以及就所选特征基因集合与Eng-Juh Yeoh的研究成果进行了比较,还包括对所选基因功能的初步探讨。通过实验我们得到了维数更少的含有38个基因的特征基因集合。然后通过ANN预测模型重新评估了选取的特征集合的性能,证实了选取的38个基因为具有最小分类错误数的最佳分类特征子集,表明了所提出的信息基因选择方法对于多肿瘤亚型的识别问题研究是非常有效的。
其他文献
为解决无人机单机任务的不足,提出了一种多参数分段式无人机轨迹规划方法,并基于此完成了四种编队队形的设计,设计并实现了多无人机编队飞行控制系统。通过开展编队飞行试验
目的:对误诊为间质性肺疾病的肺结核患者临床、影像学及病理学特征进行分析。方法:对2007年6月~2009年12月在综合医院诊断为间质性肺疾病后经病理活检确诊为肺结核的患者资料进
人类生态危机的严重性,引发了人们对生态政治的思考。什么是生态政治?生态政治的根源在何处?笔者认为,生态问题的产生,原因在于利益问题,生态利益矛盾是生态政治的关键。不同
多年来,市场调查与数据分析技术课程结合学生特点、课程特点和课程培养目标要求,本着强化操作技能培养,强调工作实战型训练的原则,紧扣职业能力要求,坚持职业性、工作过程导
近年来,随着质谱技术的发展,其应用领域也越来越广。由于质谱分析具有灵敏度高、样品用量少、分析速度快、分离和鉴定同时进行等优点,因此,质谱技术广泛应用于化学、化工、环
结直肠癌(colorectalcancer,CRC)是常见的消化道恶性肿瘤之一,严重危害着人类的健康与生命。目前认为,结直肠癌的发生是机体内因(结直肠癌的遗传易感性)和外因(饮食和环境因素)共同
混合稀土氧化物在冰晶石—氟化铝—氧化铝系熔体中的溶解度数据,对于当前在铝电解槽上加入混合稀土氧化物直接生产含混合稀土的铝合金(成品合金与中间合金)更有现实的意义。
目前我国绝大多数生产制造企业都采用直线职能制这种组织结构模式。存在各职能部门自成体系,不重视信息的横向沟通等问题。在学习和借鉴先进企业成熟做法的基础上,拟以构建‘