基于聚类正则化的线性判别分析

来源 :天津大学 | 被引量 : 0次 | 上传用户:maomao147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,多媒体和网络技术发展迅速,促使了图像数据数量的大幅度增长,因此如何能够快速、准确地获取图像数据中的有用信息成为急需解决的问题,而维数约简技术作为其中的一种解决方案,现已成为一个非常热门的研究方向。到目前为止,最具有标志性的两种方法分别为主成分分析(Principal ComponentAnalysis, PCA)和线性判别分析(Linear Discriminant Analysis, LDA)。LDA是一种有监督的维数约简方法,其基本思想是找到一个最佳的投影方向,使投影到该方向上的样本数据的类间离散度最大,同时类内离散度最小。但当每个类别中的训练样本数目较少时,LDA方法却存在着严重的过拟合问题,而造成这种现象的主要原因是根据有限数目的训练样本计算得到的类间散布矩阵和类内散布矩阵与理想的类间散布矩阵和类内散布矩阵之间存在着较大的偏差。为了解决这个问题,本文提出在不增加训练样本数目的情况下,充分利用给定训练数据自身的结构信息,先运用k-均值聚类算法形成新的样本数据,计算新样本数据的类间散布矩阵和类内散布矩阵。然后利用新样本数据的类间散布矩阵来归一化原始样本数据的类间散布矩阵,同时,利用新样本数据的类内散布矩阵来归一化原始样本数据的类内散布矩阵。这里,新样本数据的类间散布矩阵和类内散布矩阵对结果的贡献值是与每个类别中训练样本的数目成反比例关系的。最后,本文分别在AR人脸数据库和FERET人脸数据库以及Carreira-Perpinan人耳数据库上做了大量的实验,证明了本文提出的算法的优势之处。
其他文献
随着Internet网络的飞速发展和业务需求的爆炸式增长,卫星网络以其广覆盖的天然优势作为Internet网络的补充已经成为一种必然趋势。然而传统的卫星网络协议是分层设计的,这种“
伪随机码调相脉冲多普勒复合体制引信综合了伪随机码体制和脉冲多普勒体制两种引信的优点,系统同时完成对目标的测距、测速。它利用伪码脉冲的自相关特性对目标进行测距,利用多
视频监控系统广泛应用在街道、学校、银行、超市的日常监控、防盗等领域,其重要性不言而喻。而智能家居中的应用相较于其他监控模式逊色很多,虽然近年来家居视频监控的快速发展
学位
通信技术、无线网络和计算机技术的快速发展推动了信息社会的前进。信息数字化和网络化跨越了空间和时间的界限,同时影响了视频信息产业的发展变化。用户需求的增长和新媒体的
地震反射信号综合反映了地下地质结构、地层岩性和流体等信息,通过地震叠前反射信号可以反演得到地下地层的岩石弹性参数、提取岩石及其饱和流体的物性参数。随着油气勘探开发
无线局域网的快速发展需要系统提供更高的吞吐量,传统的IEEE802.11MAC协议支持单点到单点的传输,系统吞吐量的提高受限于传输碰撞和信道预约时间(帧间距),仅仅提高数据传输速率并
阵列信号处理波达方向(DOA)超分辨估计问题是近几十年研究的热点,其中均匀圆阵是最为常见的物理阵列结构,具有广泛的应用背景,比如雷达,声纳和卫星等。但是,在实际中由于均匀圆阵能
通过地震信号分类技术生成地震相图来确定地下储层对指导石油勘探有着重要作用,现有地震信号分类技术主要针对叠后信号,叠后信号是叠前信号的横向求和,导致很多地震信息丢失
随着互联网和多媒体方面的飞速成长,数字多媒体技术的应用获得了巨大的成就,比如图象、音频、视频等。但信息的安全性、版权保护等方面的问题也愈来愈受到人们的重视。在数字多