类中心均匀分布的降维方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:weibo78500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在许多模式识别和机器学习应用中,降维是一个基本的问题。近年来,为了解决类的分离问题,出现了应用最大最小思想降维的方法。这些方法特别强调类间的分离,但仅仅只明确考虑了类内的紧密性和类间的分离性,完全忽视了类中心的分布,可能不能获得优化的分类性能。在本文中,基于现存的工作,提出了三种新颖的监督降维方法,不仅考虑了类内的紧密性和类间的分离性,而且也考虑了类中心的分布,通过使类中心大致均匀分布,获得更优的分类性能。另外,提出了一种拓扑限制半等距嵌入降维方法。具体研究成果如下:  1.提出了分步的最大最小距离分析的降维方法。在最大最小距离分析降维方法的基础上,通过松弛类间最大最小距离以改变这一距离唯一决定类中心分布而可能导致类中心非均匀分布这一状况,从而使得类中心大致均匀分布。采用分步松弛和每一步小比率松弛以近似保持类间良好的分离性。提出了本方法的加速形式,以降低优化过程中的计算量。同时,也提出了本方法的核化形式,以解决训练样本不满足高斯同方差分布这一实际问题。在人工和实际数据上的实验结果表明了本方法的有效性,证实了使类中心大致均匀分布能显著提高分类性能。  2.提出了使用Fisher准则调整的最大最小距离分析的降维方法。先重新阐述了Fisher准则,再应用这一准则来调整最大最小距离分析的降维方法。通过适当的调整,在两种降维准则的共同作用下,原先子空间中近的类对变得更加分离,远的类对变得靠拢,这样既能实现类中心大致均匀分布,又能近似保持类间良好的分离性。本方法避免了迭代优化,因而计算量相对较小。提出了本方法的加速形式和核化形式,以进一步减小计算量和解决数据分布的问题。实验结果表明了本方法能使类中心大致均匀分布从而提高分类性能。  3.提出了熵调整的最大最小线性判别分析的降维方法。针对最大最小距离分析的降维方法不能保证类内紧密这一不足,首先提出了最大最小判别分析方法,这一方法通过最大化两类的类间分散度量与全部类的类内分散度量之间的最小比值来实现类内的紧密性和类间的分离性;接着,将Shannon熵调整项和相应的距离差值调整项引入目标函数,以精确地控制所有类对距离趋向相等而实现类中心大致均匀分布。这样能解决近似优化计算造成处理低维数据时分类性能下降的问题,并且进一步提高分类性能。本方法只涉及解决二次规划问题而不是半定规划问题,极大地减少了计算量。在人工和实际数据上的实验结果表明了本方法的有效性,证实了使类中心大致均匀分布能有效提高处理低维数据或子空间的维数低时的分类性能。  4.现存的流形学习方法中,那些依赖邻近点间距离来估计流形全部点间距离的方法,由于流形的非凸性,从而不能可靠地得到流形点间的真实距离。虽然通过去掉与边界相交的长测地线能够解决这一问题,但是这一做法有两个不足。首先,去掉那些仅包含少数边界点的长测地线,降低了对噪声的鲁棒性而对消除流形的扭曲几乎不起作用;其次,短测地线对噪声敏感,将它们与长测地线同等看待,可能不利于抗噪性能。为了更大程度实现等距映射,本文给出了非线性降维的调整框架。这一框架保留仅包含少数边界点的长测地线,同时降低短测地线的权重,因而对噪声具有更强的鲁棒性。而且,改进了边界点侦测并提出了补充的方法。实验结果表明了所提出的拓扑限制半等距嵌入降维方法的有效性和鲁棒性。  最后,本文对所做的工作进行了总结,并结合本文的不足之处,指出了将来可能开展的工作。
其他文献
本论文研究的是用无模型自适应控制器实现大型变桨距风力发电机的电控系统。首先,简单的介绍了控制理论、自适应控制和无模型自适应控制的发展概况以及风力发电机的现状;其次,详
可穿戴计算是一种全新的计算模式,它提供了一种无处不在的计算和交互方式,使人和计算机更加紧密地结合在一起,体现了“以人为本,以人为中心”的计算思想。可穿戴计算机系统需
随着数字摄录设备的发展和影像技术的进步,在越来越多的场合下,人们开始使用视频摄像设备来记录相关的经历和场景,如家用视频、影视媒体、视频监控等,因此各种类型的视频数据量呈
过程控制是自动化专业的一个重要专业方向,实践性很强,针对工业过程控制中多变量耦合系统,开发过程控制系统实验装置是提高过程控制实验教学水平,培养学生工程实践能力的迫切需要
基于性能势理论,对离散事件动态系统进行性能分析和性能优化时,需要计算实现因子和性能势.在这篇文章中,以遍历Markov链为模型,针对现有计算方法的不足,提出了计算实现因子和性能势
数据网格具有分布式存储和处理的能力,能够包容各种异构多样化的数据。它的出现为解决海量多样化的数据处理问题提供了良好的解决方案。副本技术是数据网格中的关键技术。它