基于人工蜂群算法的改进K-均值聚类算法及其应用

来源 :兰州交通大学 | 被引量 : 7次 | 上传用户:liuhu1314518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工蜂群算法(Artificial Bee Colony algorithm,ABC)是一种模拟蜜蜂群体合作觅食行为的群体智能优化算法,由土耳其学者Karaboga于2005年首次系统地提出。由于其操作简单,控制参数较少,收敛速度较快,易于实现等特点,吸引了越来越多的学者进行研究并有效地将其应用于函数优化、数据挖掘、神经网络、旅行商等实际的优化问题当中。但基本人工蜂群算法的函数优化过程中位置更新公式精于探索疏于开发的特性,导致算法广度与深度搜索不够充分、搜索精度不高、容易陷入局部最优解,从而影响了优化算法的性能,因此亟需对基本ABC算法进行改进研究。本文首先对ABC算法位置更新公式进行了改进,提出一种带搜索因子的全局最优人工蜂群算法,然后将改进后的ABC算法与K-均值聚类算法进行结合,克服了原始K-均值对初始聚类中心敏感以及易陷入局部最优的缺点,最后将混合聚类算法应用于某电子商务交易流水数据进行客户细分。本论文的主要工作有:(1)针对朱国普等人提出的全局最优人工蜂群算法(Gbest-guided ABC algorithm,GABC)在搜索迭代过程中未充分考虑到全局优化和局部优化在优化过程中的作用,在一定程度上降低了算法的全局搜索能力,容易陷入局部最优解的问题,本文提出了一种带搜索因子的全局最优人工蜂群算法(HF-GABC)。在GABC算法的基础上引入了可以随着优化过程动态搜索的因子,对算法的全局搜索过程和局部搜索过程中进行动态搜索。改进的算法对四个标准测试集函数分别进行仿真试验,并与ABC算法、GABC算法的结果对比。实验结果表明,带搜索因子的人工蜂群算法收敛性能优于ABC和GABC算法,有效降低了局部收敛的可能性并且提高了算法的收敛精度。(2)针对传统K均值聚类算法收敛速度快但对初始聚类中心敏感,易陷入局部最优,鲁棒性较差等缺点,论文提出一种带搜索因子全局最优人工蜂群算法(HF-GABC)与K-均值算法相结合的聚类算法(HFGABC-K),改进全局最优人工蜂群算法可以较好地提高局部搜索能力和全局搜索能力,在与K-均聚类算法收敛速度快等优点相结合,解决了原始K-均值算法过于依赖初始聚类中心和易陷入局部最优的缺陷。为了验证算法的可行性与有效性,论文选取UCI机器学习数据库中的Iris、Wine和CMC标准数据集在K-均值、ABC-K、GABC-K和HFGABC-K算法分别进行实验。实验结果表明,新的算法不但克服了传统K-均值鲁棒性较差的缺点,并且聚类效果也获得了明显改善。(3)将改进后的聚类算法主要针对某网站交易流水数据进行电子商务客户细分,详细论述了改进后的聚类算法(HFGABC-K)在客户细分中的步骤,在同一组数据上同时采用K-均值和HFGABC-K算法进行细分工作并对结果进行了分析。结果表明HFGABC-K算法的聚类效果更为紧凑和优秀,细分的质量要好于K-均值算法。最后,根据聚类结果进行评价,帮助企业制定相应的营销策略。
其他文献
随着数字媒体在网络上的普遍存在,数字媒体的版权保护日益成为人们关注的焦点。根据研究向数字媒体中嵌入数字水印技术可以有效的解决版权保护、盗版和恶意篡改数字媒体内容这
本文研究了基于GIS的城市大气颗粒物监控预警管理系统,实现对整个城市环境状况的预报、监测站环境信息的实时监控和预警、监测与预测数据的对比分析、空气质量模拟控制和环境
随着社会网络的日益普及,互联网上产生了大量的数据和文档,互联网上海量信息的提取、分类处理技术成为目前研究的热点。本文对Internet上信息进行综合深入的分析,对文本提取和处
学位
随着网络生活的拓展和生活节奏的加快,人们越来越多地通过网络进行沟通和交流,应运而生的网络交易也越来越普及,网络犯罪随之而来。而其中危害最大、最难根除网络犯罪行为之一的
信息爆炸时代的到来使人类社会的电子数据积累速度变得越来越惊人,人们希望可以利用数据库中的历史数据发掘出潜在的商业价值。TPC-H基准测试是事务处理性能委员会的重要测试标
随着数码相机的普及,功能强大的图像处理软件的出现,越来越多的人可以方便的对数字图像进行编辑处理。数字图像的安全问题也因此成为当前图像学界的一个热门且紧迫的话题。在数
近年来,伴随P2P技术的不断进步,针对P2P网络的攻击和利用其传播恶意代码的行为与日俱增。恶意代码中的蠕虫破坏性非常大,已经变为P2P网络和应用的重要威胁,严重影响了该技术的发
在现在社会中,社交网络已经成为人们快速沟通、交流的重要方式之一,通常社交网络可以理解为一种互动的多用户网站,它将用户的特征和兴趣结合起来,将用户的社交活动转变为相对
观看体育节目已经成为现代人生活娱乐的一种主要方式,随着体育视频节目的飞速膨胀,如何帮助用户找到他们感兴趣的比赛或比赛的精彩片断,成为一个亟待解决的问题。人工处理视频以