论文部分内容阅读
聚类分析是数据挖掘中的一种重要方法,并被应用到模式识别、数据分析、市场研究等多个领域。粒子群优化算法是近些年来发展起来的一种仿生优化算法,因其具有的多种优点受到学术界广泛关注和研究。本文首先分析研究了粒子群优化算法的基本思想和现有算法的算法原理和特点,并提出了一种改进的粒子群算法——FWPSO;然后分析研究了聚类分析算法的思想和分类及代表算法,并提出了一种改进的聚类算法——VBK-means;最后将这两种改进算法进行结合,提出了一种改进的混合聚类算法——FWP-VBK聚类算法。本文的研究内容主要有以下几方面:1.提出了一种改进的粒子群算法FWPSO。其引入了由每次迭代时群中粒子适应度与群体粒子平均适应度差值决定的适应度权重,通过其可以掌握每次迭代时粒子群的收敛情况。FWPSO改进粒子群算法利用适应度权重,在每次算法迭代时修正惯性权重和学习因子,使群中的粒子根据群体收敛情况,即时动态地改变自身的飞行速度,合理地调整自身学习和群体学习的比重,从而有效地跳出局部最优解,加强了全局搜索性能,并提高了收敛解的精度。实验证明,FWPSO算法的算法解精度更高,全局搜索性能更为优秀。2.针对K-means聚类算法中,合理聚类划分数难以准确给出的缺点,提出基于平衡方差评价函数的VBK-means改进聚类算法。本文综合分析研究了类内差异和类间差异与聚类效果之间的关系,提出了由类内差异和类间差异方差决定的平衡方差。并将平衡方差引入到VBK-means算法中作为评价函数,以此判断选择最合理的聚类划分数并得到最优的聚类结果。3.以K-means聚类算法缺点为易陷入局部最优解,处理海量数据效率低下,而粒子群算法全局搜索能力强,适合处理海量数据,两者结合可取长补短这一思路出发,将本文的FWPSO改进粒子群算法与VBK-means改进聚类算法结合,提出了一种改进的结合聚类算法——FWP-VBK聚类算法。通过实验测试证明,FWP-VBK聚类算法有效地克服了K-means算法的不足,在算法的有效性和算法效率上比其他算法都有明显的提高。