基于局部逼近的数据分析及其在人脸识别和基因微阵列缺失值估计中的应用

来源 :中山大学 | 被引量 : 0次 | 上传用户:tingxin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展,生物医学、工程、商业、科学研究等各个领域积累了大量的数据,并且数据积累的速度越来越快。数据积累的目的往往是希望从中挖掘出一些有用的信息,因此数据分析成为社会信息化必不可少的一个要素。本文主要探讨基于小波基的人脸图像特征逼近,及其在人脸识别中的应用。人脸图像由于受到光照、姿势、表情、平移、遮挡物的外部影响,在空间域上的结构十分复杂。因此人脸识别的关键就在于如何有效地提取不受外部变化影响的人脸特征,目前这仍然是一个开放性的问题。 ⑴探讨基于小波包局部逼近的人脸识别算法,尤其是小波包字典中的特征选择/提取问题。通过分析小波包系数的特点以及扭曲的人脸曲面的频谱特性,我们指出了经典的局部判别基(local discriminant basis,LDB)算法以及绝对距离在小波包特征提取中的缺陷,并提出了一个观点:要选择最优的判别特征,就应该不受各个坐标所在频率子带的限制,而是直接以各个坐标的判别力为准绳。然后,为了回答几个问题:如何衡量各个坐标的判别力;如何保证各个坐标的挑选不受各子带的影响;如何挑选最具判别力的坐标?我们分别提出了样本空间可分性、伸缩不变熵的概念和基于最大logistic后验概率的特征选择模型。在实现局部判别坐标(local discriminant coordinates,LDC)挑选的基础上,我们提出了一个新的人脸识别算法—LDC人脸识别算法。此外,为了改进欧式距离和cosine相关性的不足,我们提出了三角平方比的相似性度量,它同时考虑了两个向量之间的距离和相关性。 ⑵探讨基于对偶树复小波基逼近的人脸特征表示。我们提出了一个新的基于对偶树复小波基逼近的人脸特征表示—complex—WT—face。它可以有效地表示人脸图像的内在几何结构,且冗余性和维数都很低。同时我们通过实验证明了:对偶树复小波基在平移和光照变化下对人脸图像的逼近能力要优于离散小波基和Gabor小波基,并且只需要线性的计算复杂度,远小于Gabor小波基。这为对偶树复小波基取代离散小波、Gabor小波在人脸识别领域的应用提供了可能。此外,我们注意到由于人脸图像具有有限的支集,当小波的滤波器通过人脸图像的边界时,它产生的每个频率子图像的边界像素值会产生突然的跳跃变化,即Gibs振荡,所以我们提出了一个修剪的方法来抑制Gibs振荡导致的许多虚假奇异点对正常奇异点检测的影响。 ⑶提出了一个将局部加权逼近模型应用于基因微阵列缺失数据估计的理论框架,它以Taylor级数逼近为理论基础。对于每个含缺失值的目标基因,该局部加权逼近模型可以自适应地产生它的候选基因集,并且通过权重函数分配各个候选基因对缺失值估计的影响力。我们证明了该理论框架的平凡形式即是经典的KNNimpute算法,并在理论和实验层面上,详细地研究该理论框架的线性形式—局部加权线性逼近的数据估计算法(LWLAimpute)。为了更好地研究LWLAimpute算法,我们提出了拟渐进性质的概念,并通过实验证明了基于一阶逼近的LWLAimpute算法拥有很好的拟渐进性质,而基于零阶逼近的KNNimpute算法并不拥有。该性质使得LWLAimpute算法可以舍弃传统局部填充方法必须使用的预选择操作。因而对于每个含缺失值的目标基因,LWLAimpute算法可以充分利用它的所有候选基因在它周围的分布信息去估计它的缺失值,不会受到预选择操作的影响而错过一些有用的信息。所以LWLAimpute算法具备了同时挖掘局部和整体信息的能力,这是已有的微阵列缺失数据估计算法所不具备的。
其他文献
学位
本文研究了两个多车场多配送中心满载车辆路径问题。论文分为五个部分:第一章为绪论,主要阐述了满载车辆路径优化问题的背景及国内外研究现状,还介绍了本文的主要内容;第二章
分形几何是20世纪70年代中期才发展起来的一门新兴科学,其研究对象为自然界和社会生活中广为存在、复杂无序、而又具有某种规律的图形和现象.它为研究具有自相似特性的物体和
学位
模糊关系方程是模糊数学的理论基础,模糊关系方程的解法是模糊数学一个极其重要的研究课题。带有max-t-now算子的模糊关系方程的有关问题已经有很多研究。相应的,min-s-norm算
本文前两章在不同的空间中证明了KKM定理,并给出了相应的应用;第三章相对独立,研究了多值一般混合隐似平衡问题,文章主要由以下几个部分组成: 1、简述了KKM理论和变分不等式理
排序论是运筹学中最有活力的领域之一,大量不同机器环境下的排序模型已经被学者们广泛研究。本文我们是在继列批机器环境下研究工件的加工和运输之间的集成排序问题。为了节约
在过去10年的时间里,多媒体技术得到了长足的发展。今天,视频处理技术已经处于多媒体的核心地位,但是巨大的数字视频数据量,已经成为视频处理的瓶颈,因此,视频压缩编码及标准
对非标准增长条件的p(x)-Laplace方程问题的研究是近年来发展起来的一个新的研究课题。由于Laplace方程和p-Laplace方程的研究方法已经不再适用于p(x)-Laplace方程,所以目前对