基于基因表达谱的肿瘤基因及其网络结构研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:roseisdead
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划的实施,产生了大量的生物医学数据。生物信息学是基于信息科学的理论和方法,利用计算机技术,分析和研究生物医学数据的新兴学科。基于基因表达谱,在分子水平上对肿瘤进行分析和研究,是当前生物信息学研究的重要课题。本文应用人工智能的方法,对肿瘤基因表达谱进行了分析和研究,取得的研究成果主要有: 第一:提出了一种肿瘤基因表达数据残缺值处理的方法。本文以GEO数据库中的GSE4045系列结肠癌数据为研究对象。设定数据中样本的残缺值个数阈值为α,去掉残缺值个数大于α的样本,残缺值等于与残缺值样本类别相同的同一基因的均值。对处理后的数据进行聚类分析,结果显示出很好的聚类有效性。 第二:本文建立了一种通过评价备选特征基因子集的分类性能来确定肿瘤基因表达数据特征基因的方法,并基于胃癌基因表达谱提取了胃癌特征基因集合。首先应用分类信息指数、Relief、T检验、秩和检验算法,通过“肿瘤基因表达数据残缺值的处理-数据标准化-搜索差异表达基因-去冗余分析”等步骤,提取数据中的备选特征基因,再采用SVM分类器评价备选特征基因子集对样本的分类正确率。分类正确率最高,元素个数最多的备选特征基因子集即为特征基因。本文以Hippo.Y等提供的胃癌基因表达数据为研究对象,应用本标准确定了特征基因提取的算法和可有效应用于聚类分析的特征基因。分析结果可视化程度好,可解释性强,具有很好的统计学和生物学意义。 第三:应用边介数聚类算法提取了结肠癌基因网络的模块结构,并用模块度函数对聚类效果进行了定性评价。边介数聚类算法是一种基于图论的算法,计算网络中通过某条边的最短路径的条数即边介数,找出边介数最大的边并将其删除,从而使网络逐步聚成不同的子网络。这些子网络对应生物网络的功能模块。本文首先对聚类的有效性进行了研究,利用模块度函数比较了已知聚类结果的Zachary空手道俱乐部网络的边介数聚类和层次聚类的结果,证明了边介数聚类算法的有效性,也解决了无监督聚类算法需要设定聚类数的问题。本文采用的边介数聚类算法借鉴了Girvan和Newman提出的社区发现算法。利用边介数聚类算法对GSE4045系列结肠癌数据进行了分析,通过检索GO数据库验证了边介数聚类所得基因模块具有相似或相同的功能类,从而进一步证明了算法的可行性和有效性。 本文的研究工作得到了国家自然科学基金(No.60234020)的支持,相关研究成果已被DCDIS国际期刊(SCI刊源)、WCCI2008(EI刊源)和中文核心期刊《北京工业大学学报》正式录用。本文研究工作的意义在于通过发现相似性预测未知基因的功能,为肿瘤的诊断和治疗提供参考方案。可广泛应用于肿瘤相关基因发现、药物靶点发现与基因功能预测等领域。
其他文献
火电厂的化学水处理系统是厂用水的源头,化学水处理系统的工作状态直接影响着水循环管路的使用寿命和安全性。一般情况下,化学水处理系统的控制系统采用PLC或是DCS,本文将介绍在一套化学水处理仿真系统上实现与FCS的连接并实现控制应用。文中应用Motolola公司的MC9S12系列单片机配合I2C总线技术及CAN总线技术开发控制电路板,实现对化学水处理系统中的各种设备的仿真。设备的仿真主要是设备的各种故
近年来,随着生物识别技术的迅速发展,计算机笔迹鉴别逐渐成为其不可或缺的重要组成部分,它是通过比对、分析不同人书写的相同单字特征字或整体书写风格来判断书写人身份的一
本文研究了一种用于焊接特种罐体的焊接机智能控制系统。在研究过程中,首先总结和分析了前人取得的相关成果,并在吸收前人先进技术的基础上,根据本焊接机的主要技术指标和功能要
本文进行了电子整机三维布线电磁兼容(EMC)预测技术的研究。首先从电磁兼容技术的基本概念和机理出发,研究了电磁兼容的研究对象和方法。简单探讨了电子整机与EMC有关的布线特
基于通信的列车控制(CBTC)技术是当今城市轨道交通列车自动控制(ATC)技术的发展方向,数据库存储单元(DSU)是CBTC系统的关键子系统之一,负责存储CBTC系统所使用的所有数据信息
微电子、无线通信、微处理器以及微机系统等技术的进步,推动了无线传感器网络的产生和发展。无线传感器网络不需要固定网络支持,具有快速展开、抗毁性强等特点,可以广泛应用
足球机器人涉及多个学科、领域,是一个典型的智能机器人系统,为研究发展多智能体系统、多机器人之间的合作与对抗提供了生动的研究模型,是展示信息自动化前沿研究成果的窗口
基于视觉传感的焊缝跟踪技术具有信息量大、可靠性高、适用性广等特点,因而具有很大的研究和发展空间。本文在前人研究的基础上,进一步探讨了视觉传感技术的优势,并且依据实
移动机器人的运动规划首先需要考虑位姿空间中障碍物所导致的约束,即由于障碍物的存在使得机器人位姿空间中的某些姿态是不能达到的。对于非完整性机器人的运动规划,还需要考
在机器视觉领域,行人是图像、视频分析的重要关注对象,同时为了完成可移动、实时的行人检测,不仅需要在软件及算法上实现检测功能,而且需要一个小型化的智能视觉平台来搭载行