论文部分内容阅读
人工蜂群算法(Artificial Bee Colony algorithm,ABC)是一种模拟蜜蜂群体合作觅食行为的群体智能优化算法,由土耳其学者Karaboga于2005年首次系统地提出。由于其操作简单,控制参数较少,收敛速度较快,易于实现等特点,吸引了越来越多的学者进行研究并有效地将其应用于函数优化、数据挖掘、神经网络、旅行商等实际的优化问题当中。但基本人工蜂群算法的函数优化过程中位置更新公式精于探索疏于开发的特性,导致算法广度与深度搜索不够充分、搜索精度不高、容易陷入局部最优解,从而影响了优化算法的性能,因此亟需对基本ABC算法进行改进研究。本文首先对ABC算法位置更新公式进行了改进,提出一种带搜索因子的全局最优人工蜂群算法,然后将改进后的ABC算法与K-均值聚类算法进行结合,克服了原始K-均值对初始聚类中心敏感以及易陷入局部最优的缺点,最后将混合聚类算法应用于某电子商务交易流水数据进行客户细分。本论文的主要工作有:(1)针对朱国普等人提出的全局最优人工蜂群算法(Gbest-guided ABC algorithm,GABC)在搜索迭代过程中未充分考虑到全局优化和局部优化在优化过程中的作用,在一定程度上降低了算法的全局搜索能力,容易陷入局部最优解的问题,本文提出了一种带搜索因子的全局最优人工蜂群算法(HF-GABC)。在GABC算法的基础上引入了可以随着优化过程动态搜索的因子,对算法的全局搜索过程和局部搜索过程中进行动态搜索。改进的算法对四个标准测试集函数分别进行仿真试验,并与ABC算法、GABC算法的结果对比。实验结果表明,带搜索因子的人工蜂群算法收敛性能优于ABC和GABC算法,有效降低了局部收敛的可能性并且提高了算法的收敛精度。(2)针对传统K均值聚类算法收敛速度快但对初始聚类中心敏感,易陷入局部最优,鲁棒性较差等缺点,论文提出一种带搜索因子全局最优人工蜂群算法(HF-GABC)与K-均值算法相结合的聚类算法(HFGABC-K),改进全局最优人工蜂群算法可以较好地提高局部搜索能力和全局搜索能力,在与K-均聚类算法收敛速度快等优点相结合,解决了原始K-均值算法过于依赖初始聚类中心和易陷入局部最优的缺陷。为了验证算法的可行性与有效性,论文选取UCI机器学习数据库中的Iris、Wine和CMC标准数据集在K-均值、ABC-K、GABC-K和HFGABC-K算法分别进行实验。实验结果表明,新的算法不但克服了传统K-均值鲁棒性较差的缺点,并且聚类效果也获得了明显改善。(3)将改进后的聚类算法主要针对某网站交易流水数据进行电子商务客户细分,详细论述了改进后的聚类算法(HFGABC-K)在客户细分中的步骤,在同一组数据上同时采用K-均值和HFGABC-K算法进行细分工作并对结果进行了分析。结果表明HFGABC-K算法的聚类效果更为紧凑和优秀,细分的质量要好于K-均值算法。最后,根据聚类结果进行评价,帮助企业制定相应的营销策略。