改进的双聚类算法在癌症基因芯片数据中的应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:liongliong553
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物技术与生物信息学的发展,DNA芯片实验已经成为当今最重要的一种分析基因表达的非常有效的工具,基因芯片技术的应用已日渐趋向成熟。在高通量分子生物学技术不断发展和日趋完善的同时,越来越多的研究者致力于癌症基因芯片的相关研究。近年来,癌症的发病率不断增长,严重威胁着人类的健康与生命。长期以来,各国的科学家们为了治愈癌症进行了长期不懈的努力。处理基因芯片表达数据常用的方法是聚类分析,随着生物科学和技术的迅速发展,生物数据的积累速度也不断加快,呈现指数级增长趋势,传统的聚类方法的不足也日益显现出来。本文在学习和总结传统聚类算法和双聚类算法的基础上,针对癌症基因芯片数据的相关分析这一研究热点,应用改进的双聚类算法对其进行分析和讨论。具体过程如下:首先在经典的Cheng-Church算法基础上,提出了一种改进算法,通过增加了组合和扩展过程,减少了随机化对双聚类结果的影响,得到了很好的双聚类效果;其次对癌症基因芯片数据进行缺失值的填充和标准化预处理,并利用特征选择算法,如t-test和SVM-RFE两种统计学方法进行特征基因的选取;最后将改进的Cheng-Church算法应用在人工模拟数据上验证了算法的有效性,并利用该算法对GEO数据库中的前列腺癌基因表达数据进行了聚类分析,通过与KEGG数据库中现有的前列腺癌pathway中的基因比较,验证了改进算法的有效性,同时对可能与前列腺癌有关的基因进行了分析。
其他文献
地图作为中学地理教育不可或缺的重要组成部分,也是中学地理教学的核心所在。学生在中学学习地理过程中,还存在无法正确认识地图,无法获取相应知识点的问题,对中学地理学习效
文字狱是指统治者或掌权者利用霸权依主观意愿对文字作品寻章摘句、网罗罪名所制造的冤狱。从表达者的角度给文字狱分类,可以将文字狱大致分成纪实、表现、献媚、荒诞四种类型
2010年,中国法治建设中的一件大事是我国《国家赔偿法》的修订,其中将精神抚慰金作为一种国家赔偿的方式予以规定,然而大家期盼已久的精神损害赔偿制度在国家赔偿法中只是简
心理负荷是体育课堂教学中不可忽视的负荷因素,它会对学生的身心反应产生不同的影响,对课堂效率的提高起到不可低估的作用。同时,心理负荷的合理把握也对学生的心理素质的提高起
本课题所研制的竞争性胶体金试纸条以奶牛血清中的生殖激素孕酮为检测对象,通过测定血清中孕酮水平的变化来判断奶牛妊娠与否。为建立孕酮胶体金免疫层析快速检测技术,首先采用
王重民是我国现代著名学者,在目录学、敦煌学、版本学、方志学、历史文献学等诸多学术领域均有独特的贡献,尤以其目录学成就最为辉煌。对于王重民学术成就的研究已有近三十年历
汉语语法学界对方位词的研究较多,但对反向方位词的不对称性关注较少,对于不对称的解释大多从使用频率这单一角度寻找动因。本文以“上-下、左-右、前-后、里-外”这四组使用频
理性是社会行为主体对客体的一种能动的反映,它是人们认识自然和社会及其规律的一种基本能力。社会行为主体的理性在许多情况下,在很大程度上表现为工具理性,它是一种不完全
牡丹(Paeonia suffruticosa Andr.)作为我国传统名花,深受人们的喜爱与推崇。但是由于其开花时期仅限于春季,花期较短,极大限制了牡丹的发展空间。牡丹花期调控技术研究越来越显得
定语是一种语言中重要的句子成分,不同的语言定语的位置、定语的标记均有其特点。汉语结构助词“的”因其使用情况复杂、出现频率高,使得汉语结构助词“的”成为第二语言学习