基因表达数据缺失值填补算法的比较研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:wkkyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划对人类全基因组测序的完成,人类对生命的解释已经进入了功能基因时代.基因芯片技术已经较为完善并趋于成熟,已可以同时针对大量基因进行检测.如何从基因芯片技术产生的海量数据中提取有效信息,挖掘隐藏在基因表达数据下的生物学信息,进而了解生命生长过程及人类疾病的发病机理,就成为生物信息学中面临的重大挑战之一.但由于基因芯片在制备过程中,制备方法与实验因素的影响,现存的公共基因表达数据库中的基因表达数据集均存在不同程度的缺失,由于在基因表达数据的后续分析中,多数的分析方法都建立在完整数据集的基础之上,而缺失数据势必会影响后续分析结果,所以要对数据集中的缺失数据进行填补.  本文中对较为经典的缺失值填补算法进行分析与研究,将K-均值聚类算法与奇异值分解算法相结合,利用逐步逼近的思想提出一种改进算法(Adjusted SingularValue Decomposition,ASVD).利用本文中所研究的缺失值填补算法估计不同缺失机制下的缺失数据,通过均方根误差及其变型以及差异基因保持度来评价其性能及适用性.最后使用Spearman秩相关系数来检验任意两评价标准的一致性.
其他文献
椭圆型偏微分方程及其反问题的研究具有重要的理论意义和实用价值,它广泛应用于地球物理学、心脏病学、无损探伤和离子物理学还有生物电场问题等领域,如医学成像中 CT机的发
子流形理论是微分几何的一个主要分支,子流形几何的一个主要研究内容之一是Pinching问题.子流形几何的Pinching问题在欧氏空间,球面,局部对称空间,拟常曲率空间等都有研究.本文主
倒向随机微分方程是由Peng和Pardoux在1990[1]年给出了一般形式,并证明了其解的存在唯一性,倒向随机微分方程才在理论以及应用方面取得了迅速发展.倒向随机微分方程的一般形式
Toeplitz算子理论与函数论、微分方程、Von Neumann代数、非交换几何、随机矩阵、信息与控制论和量子力学等都有密切的联系。研究Toeplitz算子和Toeplitz代数对推动数学科学
Banach空间中的凸理论有重要性质,这些性质加速着Banach几何理论的发展.到目前为止,Banach空间中的凸性研究已相对完善,但一些已知的凸性的推广还不是很完善.本文以论文[10,3
图像融合是图像处理中的一个重要分支,在遥感图像,医学图像,数码图像的处理方面有着广泛应用。多聚焦图像融合能够将图像中的清晰区域提取出来,融合成为包含全部场景,并且都
群签名方案中属于群的用户能够代表该群对消息进行匿名地签名。群签名的参与者是由群管理员和群成员构成的,其中,群签名是匿名的,一旦发生争议,群管理员就可以打开签名,从而
最近邻K(KNN,K-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一,由于其实现的简单性,在很多领域得到了广泛的应用。但是,当样本容量较大以及特征属性较多时,