蚁群算法及其在聚类分析中的应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cjl7648893
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,网络和数据库技术的快速发展,使得计算机能存储大规模的海量数据;但传统的数据分析处理工具如管理信息系统对这些数据只能进行表层的处理,更深层次的数据分析能力却不尽如人意。由此,数据挖掘技术应运而生。聚类分析作为数据挖掘中的一个重要课题,是将数据区分为自然的群体并给出每个群体特征描述。通过先进算法的恰当采用,可发掘潜在的有价值的信息,提高数据分析和解释的质量,也为后续其它数据分析和整理工具对数据的再处理或理解提供科学的判断依据。因此,研究如何提高聚类分析算法的性能具有重要意义。聚类分析的算法很多,比较著名的有K-均值算法、K-中心点算法、C均值算法、FCM算法等。蚁群算法是最近几年提出的一种新的生态类优化算法,其主要特点是正反馈、分布式计算。本文根据蚁群优化算法的最新研究,对其进行了改进,主要包含以下几方面的内容:由自然蚂蚁的智能特点,引出人工蚂蚁模型。选择最典型的旅行商问题来研究蚂蚁系统的原理,实现步骤,以及算法的时间和空间复杂度。然后研究蚁群优化算法的具体实现,算法的收敛性和特点,以及算法中参数的设置等。由蚁群算法的不足提出了当前的几种改进算法,最后介绍了蚁群算法的发展和应用。由数据挖掘的概念,引出作为数据挖掘技术的重要组成部分之一的聚类分析。重点阐述了聚类分析,主要就聚类分析的定义,聚类分析的步骤,常用的数据类型和度量标准进行了简要的归纳和总结,同时简要介绍了目前比较常用的聚类分析算法,聚类分析的历史和现状,以及聚类分析的应用。基于改进蚁群算法的聚类组合方法。分析了基本蚁群聚类模型,LF算法和基于信息熵的蚁群聚类(EAC)算法,并研究了LF和EAC算法的具体实现。同时,在比较其性能的基础上,主要针对基于信息熵的蚁群聚类算法收敛速度快,但却容易陷入局部最优的缺陷,从聚类拆分、合并、孤立点处理等几个方面作了改进,从而在利用其收敛速度快的基础上提高聚类的准确性。仿真实验表明:改进后的方法在聚类的准确性和收敛速度方面都得到了很好的结果,对基于信息熵的蚁群聚类算法提供了较好的应用改进。此外,还分析了改进的单蚁群聚类算法(SACA),提出利用速度类型各异的单蚁群以SACA并行聚类,然后将产生的结果用超图模型组合成超图,最后利用基于蚁群算法的图划分算法对超图进行划分的多蚁群聚类组合方法:MACCA。
其他文献
Athena方法是安全协议分析领域中的一种新的形式化分析方法。本文首先对其进行了深入分析,然后针对安全协议形式化分析领域中的两个重要问题——类型缺陷攻击问题、组合协议
灌浆监测系统对于灌浆施工的质量保证具有重要意义,而传统监测系统的实现方式一般只是对单孔进行监测,不利于大规模的灌浆施工,而且不利于对灌浆现场的监理。同时由于信息形
从曲面的三维采样点集恢复出曲面的几何模型称之为曲面重建。曲面重建是许多研究领域如逆向工程,医学图像可视化中的重要问题,因此,曲面重建问题被广泛地研究,产生了许多曲面
低压开关设备的安全可靠性直接影响着整个供电系统的正常运行,为了避免计划维修导致的“过剩维修”和“不足维修”,本文采取模糊理论的方法对低压开关电器的工作状态进行预测,并根据器件的健康状态来制定检修计划,实施设备检修,然后应用智能故障诊断模型—改进的RBF神经网络对器件的故障进行诊断。这样不仅可以节约维修费用,而且可以减少故障排查时间。首先,对低压电气控制柜的整体结构进行了分析,由于故障最终发生在组成
随着多媒体技术和宽带网络的飞速发展,视频点播VOD(Video on Demand)的应用越来越广泛,并深受用户的欢迎。智能化住宅小区的普及,给视频点播服务带来了广阔的应用前程;宽带网