基于改进K-means聚类的系统发育谱方法在基因功能注释中的应用

来源 :东北师范大学 | 被引量 : 4次 | 上传用户:qq978458283
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着后基因组时代的到来,生物信息学的研究重心已经从序列的测序转移到对已测序的全基因组进行功能注释。随着大规模测序工具的高速发展,大通量的全基因组得到测序。仅仅依靠传统的实验方法来对这些新测序的数据进行功能分析已经远远不能满足当前的要求。因此,如何研究出基于计算的功能注释方法以代替传统的实验方法来预测这些海量数据背后隐藏的生物学功能,已经刻不容缓的成为当前生物信息学的一个重要研究课题。目前,基于计算的基因功能注释方法主要分为两大类:基于同源性的注释方法和基于非同源性的注释方法。系统发育谱方法是基于非同源性方法中常用的一种。本文通过在现有系统发育谱方法中对参照物种的选择方式进行分析,采用了构造基于权重的系统发育谱的思想,从而在保障有效的反映基因间的进化信息的同时,避免了传统的参照物种选择方法所带来的巨大的工作量。此外,本文对经典K均值聚类算法进行改进,并将改进后的聚类算法应用到对基因系统发育谱的相似性分析中去。实验结果证明,基于权值的系统发育谱的构建以及改进的聚类算法的应用能够有效的提高算法的整体性能。文章最后通过KEGG数据库做了进一步的验证,结果证明了本文的改进是行之有效的。
其他文献
随着科学技术快速发展,人们对社会生产发展信息化、物联网化提出了新要求。目前还有许多传统大棚种植还停留在人工管理,或者使用上世纪西方国家的淘汰设备。现在嵌入式设备已
目前,图像和视频正成为多媒体的主要表现形式,如何有效地从大规模图像库中快速检索出用户真正需要的图像,已成为实际生活中急需解决的问题。传统的CBIR技术多通过分析图像视
无论是因为对人工智能理论研究的贡献,还是因为实际的应用前景,作为人工智能的一个重要分支,智能规划的研究价值不可小觑,近年来研究成果颇多,成绩斐然。为了让智能规划能处
粗糙集理论是一种新兴的处理不精确、不确定与不完全数据的数学工具。决策支持系统强大的辅助决策以及粗糙集理论强大的信息处理功能已日益显露出来并为人们所关注。本文从农
随着Internet的发展,电子商务已成为当前一种重要的商务方式。在商务活动中,买卖双方在交易时必然会因商品属性的要求不同而产生冲突和争议,这时一般采用谈判方式来达成共识
随着Web服务技术的成熟与发展,组合已有服务提供新的增值服务成为一种具有重要价值的应用构造模式,服务组合技术成为了集成技术发展的新方向。QoS驱动的组合服务动态选取作为
电子制造业竞争日益激烈,产品投放市场时间越来越短,生产周期也日益缩短,何提高SMT系统生产效率,即SMT系统优化成为摆在我们面前的问题。 介绍了SMT系统组成,结构,工艺流程,发展
随着互联网技术的发展,网络安全问题已经成为目前计算机网络发展所迫切需要解决的问题。传统防火墙在保证网络安全中发挥了显著的作用,但在不断扩大的网络规模和日益多样化的网
随着无线通信的日益发展,用户对网络业务的种类和服务质量要求越来越高。为了保证网络传输的可靠性,差错控制技术应运而生。其中,自动重复请求ARQ(Automatic RepeatreQuest)