基于不定核的大间隔聚类算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wangya110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核方法是机器学习领域中解决非线性学习问题的一种有效方法,大都要求核函数正定,然而,在实际问题中这样的要求常常很难满足;相反,在某些情况下,使用不定核往往能取得比正定核更好的效果,如基因识别、目标检测问题等。近年来,不定核问题越来越受到研究者们的关注,多种解决不定核分类问题的方法被提出并取得很好的效果,如谱变换方法、正定核替代策略等。然而,关于不定核聚类问题的研究却相对较少,现有基于核的聚类算法也大都基于正定核,不能直接处理核函数不定的情况。鉴于已有不定核方法在分类问题中的优异表现,本文希望借助这些方法研究基于不定核的聚类问题。具体地,本文以经典的基于核的大间隔聚类模型(Maximum Margin Clustering, MMC)为基础,提出了一种基于不定核的大间隔聚类模型(Indefinite Kernel Maximum Margin Clustering, IKMMC)。IKMMC采取正定核替代策略,寻求一个正定核以逼近不定核,并将度量二者差异性的F-范数作为一个正则化项嵌入到MMC模型中,进而得到IKMMC模型。针对该模型,本文选取了迭代优化方法进行优化:首先给样本赋初始类别标记,在每轮迭代中,不定核聚类问题被转化为带有类平衡约束的不定核支持向量机(Indefinite Kernel Support Vector Machine, IKSVM)问题,并被进一步表达为半无限规划(Semi-infinite Programming, SIP)形式求解;本轮优化得到的样本预测标记作为下轮迭代的样本初始标记,直到样本预测错误率不再满足迭代条件;最后,IKMMC以最后一轮的样本预测标记作为聚类的最终结果。实验部分验证了IKMMC及其迭代优化算法的有效性。MMC模型主要用于两类样本聚类,为了使IKMMC能够适应更为复杂的多类情况,本文进一步提出了多类情况下的IKMMC模型,并给出了相关优化算法,通过在多个数据集上的实验证明了IKMMC及其优化算法在多类情况下依然有较好的方法性能。
其他文献
无线局域网(WLAN)是一种融合了局域网(LAN)技术和蜂窝网(GSM/GPRS)技术的无线宽带接入方法,由于其具有灵活性和经济性的特点而得到了非常广泛的应用。但是,由于无线信道的开放
软件无线电是将模块化、标准化的硬件单元以总线方式连接构成的基本平台,并通过软件加载实现各种无线通信功能的一种开放式体系结构。但由于在功能的实现上受A/D芯片,D/A芯片的
在各种嵌入式操作系统当中,Linux系统由于具有良好的开源性,可移植、可裁剪以及安全稳定和强大的网络功能等优点,使得Linux系统在嵌入式领域取得了巨大的发展。但是,Linux是一种
微粒群是一种模拟动群体物行为的智能优化算法,同时它也可以模拟人类的社会行为,至今很少有人从人类社会方面来研究微粒群算法。因此本文引入人工社会的思想和个体决策的理论
智能视频监控是当前世界上机器视觉研究领域中的一个热点,它结合人工智能、计算机图形学、模式识别等研究领域的成果,自动地解析视频监控设备采集的视频流,为监控者抽取和提供关
传统的密码学协议大多基于难解性问题假设,如大数分解问题以及离散对数问题等。建立在这些问题上的安全性,我们称之为计算安全性。这意味着,当协议破坏者具有无限的计算资源
自上世纪80年代以来,内存数据库相关技术飞速发展并且得到了越来越多的研究和关注。目前应用程序的规模和复杂度不断增加,尤其是大量Web应用的产生和发展,应用系统对于为其提
随着多媒体技术的发展,人们对视频图像的分辨率提出了更高的要求。高分辨率图像能提供目标物体的更多细节信息,这对于图像的分析和处理有重要作用。然而,传感器的物理限制及
随着三维建模技术、三维扫描技术的发展,数字世界的三维模型呈海量增长,从如此多的三维模型中获取有用的信息,搜索引擎是必要的工具。基于文本的方式在描述三维模型及检索上
分数阶微分理论用于图像处理是一个新的研究方向。分数阶微分对图像高频信号的强化作用相对整数阶微分要缓和得多,但对信号的低频、甚低频部分则会非线性的保留。因此,将分数阶