基于遗传算法的模糊聚类技术研究及应用

来源 :西安科技大学 | 被引量 : 0次 | 上传用户：loyovue0603

【摘要】

：

诸多基于目标函数的聚类算法中,模糊c均值算法(FCM)的理论最为完善、应用最为广泛。从本质上讲,它是一种局部搜索算法,采用迭代的爬山技术寻找问题的最优解。因此它有一个致

【作者】

：

张秀兰

【机构】

：

西安科技大学

【出处】

：

西安科技大学

【发表日期】

：

2009年期

【关键词】

：

模糊聚类模糊c均值算法遗传算法文本聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

诸多基于目标函数的聚类算法中,模糊c均值算法(FCM)的理论最为完善、应用最为广泛。从本质上讲,它是一种局部搜索算法,采用迭代的爬山技术寻找问题的最优解。因此它有一个致命弱点,即对初始化敏感而容易陷入局部极小值。遗传算法是一种应用广泛的全局优化方法,它的主要优点是简单、通用、鲁棒性强,比盲目的搜索效率要高,又比针对特定问题的算法通用性强,是一种与问题无关的求解模式。遗传算法的这些特点克服了FCM对初始化敏感的问题。因此,把遗传算法与FCM结合起来,既可以发挥遗传算法的全局寻优能力又可兼顾FCM的局部搜索能力,从而提高收敛速度并更好地解决聚类问题。通过对FCM算法、遗传算法以及遗传聚类算法的研究,本文提出了一种改进的遗传模糊聚类算法(IGFCM),这种算法采用遗传算法对初始聚类中心进行优化并执行FCM算法,使遗传算法与FCM结合以弥补它们自身的缺陷,提高了收敛速度并改善分类效果。首先,在遗传算法中,采用把聚类中心作为染色体的符号编码方法,这种表示方法不但能使染色体编码长度变短,又能使交叉、变异后的搜索空间保持不变;其次,在进行选择操作时采用最优保存策略,保留遗传过程中适应度最高的个体,让它不参与交叉、变异操作而直接进入下一代,然后采用轮盘赌方法,根据适应度函数对应的概率分布选出合适的个体,并进行交叉和变异,以提高群体的平均适应度,保证每一代在进化过程中当前最优个体不会被遗传操作所破坏;最后,采用设定最大迭代次数和根据遗传收敛程度相结合的停止准则,减小误差并缩短遗传算法的运行时间。本文通过MATLAB进行实验仿真,使用IRIS数据集比较测试FCM算法、GFCM算法和文本提出的IGFCM算法的性能,证明了IGFCM算法能克服FCM算法中的初始化敏感的缺点,验证了IGFCM算法运行时间比GFCM算法短,最后讨论了该算法在文本聚类中的应用。

其他文献

基于直觉模糊的多属性决策问题研究

基于Cantor集合理论描述现象非此即彼，无法处理具有模糊性和不确定性的信息与数据的情况，Zadeh[1]提出了模糊集理论，将取值仅为1或0的特征函数扩展为可在闭区间[0,1]中任意取值

学位

直觉模糊集Cantor集合理论距离测度多属性决策

纳税服务中的“微信公众号”

在信息时代,税务部门向“微信息化”方向探索是优化纳税服务体系、提高行政管理效能的有效途径。“微信公众号”是能有效实现“微信息化”的工具之一,且操作简便,平台更开放

期刊

国税局行政管理信息时代查询系统实时查询常规服务涉税事项状态查询采集通道人工服务

智能型电动执行器的研制

期刊

几类高阶边值问题解存在性的判别准则

本论文由三部分组成，在第一部分，我们研究了一类2n阶差分边值问题，通过建立问题的变分结构.利用临界点理论中的变分法和山路引理，得到边值问题存在至少一个解或至少两个解的判别

学位

2n阶差分方程边值问题多重解变分法临界点理论Green函数

代数体函数的几个注记及随机Dirichlet级数

本文主要运用 Nevanlinna 值分布理论和概率论的理论研究代数体函数及随机 Dirichlet级数.全文分三部分.首先通过一个实例，得出了代数体函数的分支点集与极点集之间无包含关系

学位

代数体函数分支点重值问题随机Dirichlet级数

基于遗传算法的模糊聚类技术研究及应用

其他学术论文