面向缺损数据的流形学习方法研究

来源 :华侨大学 | 被引量 : 0次 | 上传用户:cupcome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在很多实际应用问题中,高维数据集可能具有缺失数据值。如在视频监控中,监控目标可能被其他物体部分遮挡,此时只能获取监控目标的部分图像,这些被遮挡的图像即为缺损数据,如何挖掘缺损数据的本质特征尤其是非线性特征逐渐成为机器学习和数据挖掘的一个热点。流形学习作为一种非线性的降维技术,能够较好地挖掘高维数据的非线性特征。但是,传统的流形学习算法大多基于一种近似理想的情况下,即样本数据均匀采样于一个高维欧式空间中的低维流形。当数据缺损时,流形学习的效果会受到很大的影响。因此,本文主要围绕现有流形学习算法无法较好地挖掘缺损数据集的非线性特征问题展开,从构造缺损数据集的局部邻域和局部几何结构出发,提出可以较好地挖掘缺损数据集的流形学习算法。本文主要有以下两个方面的工作:1.针对缺失像素的图像集,我们提出了一种面向缺失像素图像集的修正拉普拉斯特征映射算法。该算法将缺失像素图像集看成向量集,首先利用图像向量之间的余弦相似度衡量缺失像素图像之间的距离,构造样本点的近邻域。然后提出一种新的权值构造函数,构造权值矩阵。最后,通过极小化价值函数计算样本点的低维嵌入坐标。在多组真实图像集上的分类实验结果表明,修正的拉普拉斯特征映射算法可以很好地挖掘缺失像素图像集的内在流形结构,减弱缺失像素带来的不良影响。2.我们提出了一种基于核范数正则化的局部切空间排列算法(Local Tangent Space Alignment via Nuclear Norm Regularization,简称LTSA-NNR)。该算法首先使用余弦相似性的度量方法构造缺损数据的局部邻域,然后提出了一种核范数正则化模型用于提取邻域的局部坐标,区别于传统的流形学习算法,LTSA-NNR算法提取的局部坐标的维度位于一个合理的范围内。最后,将这些局部坐标进行排列,构造缺损数据的全局坐标。我们在一些真实数据集上进行了多个可视化实验和分类实验,用以证明LTSA-NNR算法的有效性。
其他文献
<正> 一、问题的提起皮革最主要的用途是制鞋。目前全世界轻革年产的50%用于制鞋工业,底革虽为橡胶及合成材料所部分取代,有大幅度减产的趋势,但一般高档皮鞋仍采用底革,数量
<正>这是一个鞋业市场云波诡谲、战火硝烟的年代;这是一个人民币升值、原材料价格上涨、用工费用剧增的年代;这是一个鞋企老板卷款潜逃、跳楼见于报端和网络的年代。在这个年
通过构造股权再融资价值创造关于其影响因素的函数关系式,对2000-2007年间我国A股上市公司以及2006年间我国香港上市公司的股权再融资,为全体股东创造价值的能力进行估算与比
参照ASTM D 3884-2009标准测试原理,应用Taber耐磨试验机对软面皮革、人造革、合成革、超纤革和纺织品等常用鞋面材料的耐磨性能进行了测试与分析。针对砂轮型号和负荷,进行
低温胁迫是蔬菜生产过程中的主要逆境因子,对蔬菜作物的生长发育、商品产量形成影响极大。本文综述了蔬菜作物耐低温性的遗传模型、生理调节和分子机制,展望了蔬菜作物耐低温
通过考虑宏观经济波动性对利率波动性的影响,实证比较研究了中国短期利率的波动性效应.研究表明:1)中国短期利率的波动率同时存在显著的水平效应、ARCH效应和正向宏观经济效
本文概述了香菇多糖作为菌类药物的研究现状及其免疫药理作用,介绍了香菇多糖提取分离方法和结构组成,提出了作者对利用香菇多糖作为免疫佐剂应用前景的看法。
浙江省人民代表大会常务委员会根据《中华人民共和国海域使用管理法》于2012年11月29日通过《浙江省海域使用管理条例》规定,工业、商业、旅游、娱乐和其他经营性项目用海以
<正> “世界文明珍宝——大英博物馆250年之藏品展”在北京首都博物馆开幕,这是大英博物馆首次在中国办展。与中国公众见面的272件稀世文物中,有从被喻为“人类摇篮”的坦桑
全面而合理的生态设计策略是决定我国当前新农村住宅建设品质的重要因素。从生态建筑与景观设计的角度出发,以地处徐州平原地区的农村住宅为研究对象,对当地现有新农村住宅中