基于稀疏学习的图像维数约简和目标识别方法研究

被引量 : 0次 | 上传用户:weisu890221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在科学研究的很多领域,如人脸识别、生物信息学、信息检索等,所获取的数据往往具有很高的维数。这使得研究人员面临维数灾难问题。由于高维空间中过高的计算代价限制了很多技术在实际问题中的使用。当训练样本数小于特征维数时,模型估计的性能也会大大下降。如何从高维数据中学习到一个符合实际应用需求的有效低维表示已经成为模式识别、机器学习、数据挖掘、计算机视觉等领域的研究热点。在实践中,人们通常使用维数约简来处理维数灾难问题。在过去几十年中,人们提出了各种各样的维数约简方法。然而很多流行的维数约简方法都存在着一定的局限性,比如主分量分析(PCA)是一种很好的数据表示方法,但由于没有利用类标信息,对分类问题来说并不是一个很可靠的方法。由于利用了类标信息,线性判别分析(LDA)在分类问题上比PCA更有效,但它至多只能提取K-1个特征(K是类别数)且面临小样本问题。流行的局部结构保持方法如局部保持投影(LPP)存在需要人工定义近邻图的问题。最近提出的稀疏结构保持方法稀疏保持投影(SPP)计算复杂度非常高。因此,本论文以稀疏学习为工具,提出了一系列有监督和半监督维数约简方法以更快速更有效的学习高维数据的低维表示和一个鲁棒的目标识别方法,并将所提方法成功应用于人脸识别、文本分类、遥感目标识别等实际问题。所取得的主要研究成果包括:1.提出了两种新的高效的维数约简方法:快速稀疏保持投影(FSPP)和快速Fisher稀疏保持投影(FFSPP),它们以保持高维数据中的稀疏表示结构为目的。已有的稀疏保持投影方法中的稀疏表示结构是通过求解n(样本数)个耗时的1范数优化问题来获得的,所提的FSPP通过逐类PCA分解构造字典并基于该字典通过矩阵向量乘来学习稀疏表示结构,这样可以大大降低学习稀疏表示结构的计算复杂度。FFSPP通过将Fisher约束加入到FSPP的模型中以达到同时考虑稀疏表示结构和判别效率的目的,这进一步提升了FSPP的判别能力。所提出的两个方法的求解最后都可归结为一个广义特征值问题。在公共人脸数据库和标准文本数据库上的实验结果验证了所提方法的可行性和有效性。2.提出了一种新的用于人脸识别的维数约简方法稀疏正则判别分析(SRDA),其目的是同时寻找一个最优判别子空间并保持数据的稀疏表示结构。具体来说,SRDA首先通过逐类PCA分解构造一个级联字典,并基于所构造的字典通过矩阵向量乘快速学习稀疏表示结构。然后SRDA通过使用学习到的稀疏表示结构来正则化线性判别分析以达到同时考虑稀疏表示结构和判别效率的目的。最后通过求解一个广义特征值问题获得数据的最优嵌入。在公共人脸数据库上的广泛实验验证了所提方法的可行性和有效性。3.针对单标记图像人脸识别问题,提出了一种基于子空间类标传播和正则判别分析的半监督维数约简方法(SLPRDA)。首先,基于子空间假设设计了一种类标传播方法,将类标信息传播到无类标样本上。然后,在传播得到的带类标数据集上使用正则判别分析对数据进行维数约简。最后,在低维空间使用最近邻方法对测试人脸完成识别。另外,为了提高所提方法处理非线性数据的能力,基于核方法推导出了所提方法的非线性版本。在公共人脸数据库上的实验验证了所提方法的可行性和有效性。4.提出了一种新的半监督维数约简方法,双线性回归(DLR),以处理单标记图像人脸识别问题。DLR在寻找最优判别子空间的同时尽可能的保持数据潜在的稀疏表示结构。具体来说,首先提出了一个子空间类标传播方法(SALP)来将类标信息传播到无类标样本上,这一过程主要通过线性回归(LR)完成。然后,基于传播得到的带类标数据集,通过线性回归(LR)构造一个稀疏表示正则项。最后,为了同时考虑判别有效性和对稀疏表示结构的保持,DLR使用之前构造的稀疏表示正则项对线性判别分析进行正则化,在公共人脸数据库上的大量实验验证了所提方法的有效性。5.针对含有残缺图像的遥感图像目标识别问题,提出了一种基于旋转扩展和稀疏表示的目标识别方法(RETSRC)。首先对训练集进行旋转扩展,使得测试图像能近似用训练集稀疏表示,然后通过求解一个1范数最小化问题得到测试图像相对于训练集的一个稀疏表示,进而根据不同类对应的稀疏表示对测试图像的近似程度进行识别。与几种代表性的方法进行了比较,实验结果与分析表明,本文提出的方法识别率优于已有的方法,对残缺图像的识别有很好的鲁棒性,且在小样本情况下也能保持较好的识别性能。
其他文献
股利政策是现代公司金融理论三大核心内容之一,股利分配政策是上市公司利润分配的核心。在特定的市场环境下,作为资本市场微观基础的上市公司,在追求公司价值最大化的条件下,
介绍了TOFD检测技术的发展过程、TOFD检测的原理、优点及其局限性,对TOFD检测主要应用范围进行了阐述。
代理是代理人依据代理权,以本人的名义与第三人实施民事法律行为,而后果由本人承担。代理授权行为是代理法律关系的核心要素之一,对其法律地位的不同认识将直接影响到代理行
<正>音乐和文学的交织在十九世纪上半叶的德国表现得十分显著,这一时期的文学对音乐产生了极大的影响和推动作用。德国这一时期涌现出的浪漫派文学家如海因里希·瓦肯罗德(He
传统的高中英语教育教学强调基础知识的学习和技能的培养,已经不能适应现在以培养提高资源开发为目的的素质教育的需求。而且,由于受到各种因素的影响,高中英语教育教学的质
随着城市化进程的加快,土地征收活动越来越频繁。土地征收之后,如何对土地所有者给予合理的补偿直接关系到农民的切身利益和国家的稳定团结,因而对土地征收补偿制度的研究至
对航空标准化将出现的发展趋势,从民机标准、军民通用标准、全球性标准等方面进行了分析。
2010年9月29日,万众瞩目的第16届亚运会奖牌首次惊艳亮相,引起观众的一片赞叹!亚运奖牌有一个响亮的名字:《海上丝路》,是由广州美术学院张海文教授及设计师张懿、张聪设计的
兽药残留产生的原因是多方面的,在养殖过程中,由于兽药投入品的不合理使用,再加上工业和生活污染,造成畜产品药物残留及有害物质超标。在加工过程中,由于一些经营者违法、违规使用
托克维尔政治思想的问题意识可被概括为“托克维尔问题”,包括“民主铁律”、“自由至上”、“结合难题”三个层次。时至今日,这三个层次都未得到充分的认知与妥善的解决。托