半监督谱聚类算法的研究及在图像分割中的应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:backaroo2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习和数据挖掘领域中,大量的带标签样本的获取需要付出昂贵的代价,但未标记数据却随手可得。基于此,一种新的学习方式半监督学习产生了,由于半监督学习既可以利用带标签数据进行监督学习又可以利用无标签数据进行无监督学习,所以它成为了数据挖掘领域的研究热点。谱聚类算法是一种高性能计算方法,此算法的聚类空间可以是任意形状的,并且能够收敛于全局最优解。半监督谱聚类算法将监督信息加入到谱聚类中,对聚类效果起到改进的作用,因此该算法具有很高的研究价值。本文主要的研究工作是半监督谱聚类以及在图像分割中的应用,首先基于NSDR(Near Strangers or Distant Relatives)模型提出一种基于NSDR模型的半监督谱聚类算法;然后提出了一种约束扩展方法,并基于该约束扩展方法提出了一种基于约束扩展的半监督谱聚类。通过实验验证,新算法具有可行性并且对聚类的改进效果较明显;最后将新算法应用到了图像分割中。本文的创新点主要表现在以下几个方面:(1)提出一种基于NSDR模型的半监督谱聚类(NSDR-SSC,Semi-supervised SpectralClustering based NSDR, NSDR-SSC)算法。该算法基于NSDR模型,利用数据的空间结构假设以及监督信息指导数据间的相似性估计,并以此来修正相似度矩阵,进而实现监督信息指导谱聚类的效果。(2)提出一种基于约束扩展的半监督谱聚类(CE-SSC,Semi-supervised SpectralClustering based Constraints Expansion)算法。该算法首先通过一种基于密度的约束扩展方法来对有限的成对约束信息进行扩展,然后将较多的监督信息应用在(1)中所述的NSDR-SSC算法中,以达到监督信息更好地指导聚类的效果。(3)将两种半监督谱聚类算法成功应用在了图像分割中。将谱聚类相关算法应用在图像分割中是有一定挑战的,因为谱聚类算法需要求相似度矩阵以及特征值,导致谱聚类在处理大规模数据集时的开销会非常大,并且在图像分割中会随着图像的增大,相似矩阵成幂级数增长,本文使用了Nystr(o|¨)m逼近方法来解决此问题。
其他文献
学位
目前三维建模在家具、游戏动画、机械制造等领域应用广泛,三维模型的数量有了较大的增长,相应地给管理及生产设计带来了困难。因此,为了解决对现有三维模型的检索和重用需要,三维模型分类技术应运而生。如何在尽可能完美地表达三维模型形状的情况下对三维模型识别是当前的研究热点。传统的三维模型分类方法主要依赖工程师人工设计特征进行分类,时间消耗冗长且分类精度低。鉴于三维数据高维性和复杂性的特点,直接用于表达三维形
错那洞穹隆是藏南特提斯喜马拉雅地区新发现的一个片麻岩穹隆构造.穹隆核部发育一套早古生代眼球状片麻岩.本文在野外地质调查的基础上,利用LA-(MC)-ICP-MS对花岗质片麻岩2个
物联网的应用和研究越来越广泛,包含有EPC电子标签、物联网软件、电子商务、物联网体系结构等方面。物联网的目标就是要形成一个全球范围内的网络,即如何在企业间搭建内部的
大兴安岭中生代火山岩的成因和构造背景一直存在争议.内蒙古西乌旗地区发育大面积的晚中生代火山岩,是中国东部巨型火山岩带的重要组成部分.本文对西乌旗罕乌拉地区白音高老
智能手机上的移动服务在普适计算环境中应用越来越广泛,然而移动服务的开发需要开发人员做大量服务相关的工作,移动服务的共享困难,手机上的移动服务缺乏一个统一通用的框架
滴水山金矿床为北祁连造山带西段赋存于火山岩中的构造蚀变岩型金矿床.LA-ICP-MS锆石U-Pb测年结果表明,滴水山金矿区安山质晶屑凝灰岩年龄为(479.7±6.9)Ma,形成时代为早奥陶
自然语言中否定是一种广泛存在且复杂的语言现象,其往往会反转文本表述中命题的真值、观点的立场、情感和态度的极性。对否定信息进行识别,将其与事实信息区分处理,将极大提高从