一种基于改进粒子群和K均值结合的聚类算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:libra163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中的一种重要方法,并被应用到模式识别、数据分析、市场研究等多个领域。粒子群优化算法是近些年来发展起来的一种仿生优化算法,因其具有的多种优点受到学术界广泛关注和研究。本文首先分析研究了粒子群优化算法的基本思想和现有算法的算法原理和特点,并提出了一种改进的粒子群算法——FWPSO;然后分析研究了聚类分析算法的思想和分类及代表算法,并提出了一种改进的聚类算法——VBK-means;最后将这两种改进算法进行结合,提出了一种改进的混合聚类算法——FWP-VBK聚类算法。本文的研究内容主要有以下几方面:1.提出了一种改进的粒子群算法FWPSO。其引入了由每次迭代时群中粒子适应度与群体粒子平均适应度差值决定的适应度权重,通过其可以掌握每次迭代时粒子群的收敛情况。FWPSO改进粒子群算法利用适应度权重,在每次算法迭代时修正惯性权重和学习因子,使群中的粒子根据群体收敛情况,即时动态地改变自身的飞行速度,合理地调整自身学习和群体学习的比重,从而有效地跳出局部最优解,加强了全局搜索性能,并提高了收敛解的精度。实验证明,FWPSO算法的算法解精度更高,全局搜索性能更为优秀。2.针对K-means聚类算法中,合理聚类划分数难以准确给出的缺点,提出基于平衡方差评价函数的VBK-means改进聚类算法。本文综合分析研究了类内差异和类间差异与聚类效果之间的关系,提出了由类内差异和类间差异方差决定的平衡方差。并将平衡方差引入到VBK-means算法中作为评价函数,以此判断选择最合理的聚类划分数并得到最优的聚类结果。3.以K-means聚类算法缺点为易陷入局部最优解,处理海量数据效率低下,而粒子群算法全局搜索能力强,适合处理海量数据,两者结合可取长补短这一思路出发,将本文的FWPSO改进粒子群算法与VBK-means改进聚类算法结合,提出了一种改进的结合聚类算法——FWP-VBK聚类算法。通过实验测试证明,FWP-VBK聚类算法有效地克服了K-means算法的不足,在算法的有效性和算法效率上比其他算法都有明显的提高。
其他文献
天文学是一门古老的科学,自有人类文明史以来,天文学就有重要的地位。观测仪器设备及数据收集能力的大幅度提高,使得我们迈入了天文观测数据的“雪崩”时代。天体在光学波段
本文对个性化信息检索的关键技术和用户兴趣模型进行了研究,并针对勘探与生产分公司对门户个性化信息检索的需求,在分析勘探生产门户体系结构、组成及信息组织方式的基础上,
随着多媒体、网络技术的飞速发展,科学技术的推广应用以及人民生活水平的逐步提高,出现在人们面前的视频信息越来越多。如何高效地组织管理这些包含巨大信息量的新型媒体,以
随着互联网技术的迅速发展,Web系统的功能越来越丰富,人们对Web产品质量的要求也在增加。软件测试作为一种保证软件产品质量的有效手段,其作用日益凸显。仅仅依靠以劳动密集
随着Internet的迅速发展,网络中XML文档的数量呈指数级增长,XML关键字查询成为近年来XML数据查询的一个研究热点。为了解决XML关键字查询中语义信息丢失导致查询结果质量不高
在数字视频处理和计算机视觉领域的各种应用中,目标检测和跟踪是一个重要的,也是最基本的任务。目前在目标检测和跟踪方面的一些较流行的应用有自治车辆导航、机器人控制、基
21世纪人类社会进入了信息时代,开始了一场新的技术革命。而这场技术革命的主要内容就是关于物联网的研究。随着科技的进步,人们的生活水平的不断提高,人类开始不再满足于简简单
无线传感器网络被认为是引领未来经济和社会发展的革命性技术,它将计算、网络和物理环境有机的融合,能够实现物理世界与信息世界的实时感知、信息交互和动态控制。无线传感器
我国煤矿事故频发,构建基于无线传感器网络的智能监控系统将有效改善事故检测能力和灾后应急处理能力,是煤矿安全生产布局和信息化建设的着力点。无线传感器网络存在严重的能
在现代民航业内,对客运需求的预测是航空公司收益管理的核心问题,精准的需求模型可以帮助航空公司更好的制定销售策略,降低成本并提高收益。传统的需求建模以历史客运数据为