基于模糊理论的谱聚类算法研究与应用

被引量 : 0次 | 上传用户:hhenry123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚类是近几年研究得比较多、应用逐渐广泛的一种聚类分析算法。谱聚类算法建立在谱图理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。谱聚类算法还利用特征向量构造简化的数据空间,在降低数据维数的同时,使得数据在子空间中的分布结构更加明显。本文首先详细的介绍了谱聚类算法及其分类,分析了谱聚类算法面临的挑战以及存在的问题,总结性地提出了几个有价值的研究方向。接着简单的介绍了谱图理论,然后根据图划分准则对谱聚类算法进行分类,着重阐述了各类中的典型算法,并对算法进行了比较分析;以模糊理论概念为前提,分析其在聚类中的应用;讨论了几种常用的有效性评价的方法,并对各种方法做了分析。本文随后提出的自适应半监督模糊谱聚类算法,利用半监督机器学习技术、自适应聚类算法和FKCM,解决算法中存在的聚类数目需要事先确定、易陷入局部最优、收敛速度缓慢、对孤立点敏感等缺陷。实验证明该算法聚类效果很好。最后,本文在自动确定聚类数目的基础上,结合模糊理论与谱聚类算法,提出了一种应用在多文本聚类中的模糊聚类算法,该算法主要描述了如何实现单个文本同时属于多个文本类的模糊谱聚类方法。实验仿真结果表明该算法具有很好的聚类效果。
其他文献
我国飞碟射击项目从事专业训练运动员数量较少,具备高水平且发挥稳定的运动员更少,客观上要求飞碟射击运动员的训练中解决好选材、延长高水平运动员的训练年限等问题,提高训
近年来,学术界关于京派散文的研究取得了很多成果,但在京派散文理论研究方面亟需加强,这是本文的切入点。京派散文理论是京派散文家们有意识的建构,形成基本的共同点,并把散
我国有许多企业把ERP作为一个会计信息系统引入,并将ERP的功能扩展到会计核算领域,通过ERP来进行信息的管理、归集,增加企业的核心竞争力。ERP的引入,提高了企业效率,但也带
近几十年来,全球电子工业的膨胀式发展给社会带来堆积如山的电子垃圾,世界各国纷纷出台应对之策以减少污染。2001年,欧洲议会和欧盟理事会审查并通过了“电子电气设备中限制
现如今,多校区办学已经是高等教育发展过程中的一种普遍现象。但是多校区办学所带来的管理问题也如雨后春笋般日益显现,这严重阻碍了我国高等教育持续、健康发展。因此,分析
改革开放以来,我国的中小企业获得了迅猛发展,成为国民经济中一支不可缺少的经济力量。然而随着市场经济的发展,中小企业面临的竞争也日益加剧,传统的成本管理理念已经不能适
目的探讨老年人社区获得性肺炎的临床特征。方法总结分析我院老年病科2007年8月至2008年7月收治的62例老年人社区获得性肺炎的临床资料。结果老年人社区获得性肺炎的临床表现
品牌已经成为21世纪农产品贸易中新的竞争力。农产品品牌建设有利于增强农产品的竞争力,有利于推动农业走产业化经营之路,有利于促进我国新农村建设的发展。作为一种高质量、
资产密集型企业对企业资产管理的好与坏,直接关系到企业在市场的核心竞争力。企业资产管理是刚从国外引进的先进的管理方法,它对企业资产的整个生命周期进行全程管理。它不仅