基于遗传算法的模糊聚类技术研究及应用

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:loyovue0603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
诸多基于目标函数的聚类算法中,模糊c均值算法(FCM)的理论最为完善、应用最为广泛。从本质上讲,它是一种局部搜索算法,采用迭代的爬山技术寻找问题的最优解。因此它有一个致命弱点,即对初始化敏感而容易陷入局部极小值。遗传算法是一种应用广泛的全局优化方法,它的主要优点是简单、通用、鲁棒性强,比盲目的搜索效率要高,又比针对特定问题的算法通用性强,是一种与问题无关的求解模式。遗传算法的这些特点克服了FCM对初始化敏感的问题。因此,把遗传算法与FCM结合起来,既可以发挥遗传算法的全局寻优能力又可兼顾FCM的局部搜索能力,从而提高收敛速度并更好地解决聚类问题。通过对FCM算法、遗传算法以及遗传聚类算法的研究,本文提出了一种改进的遗传模糊聚类算法(IGFCM),这种算法采用遗传算法对初始聚类中心进行优化并执行FCM算法,使遗传算法与FCM结合以弥补它们自身的缺陷,提高了收敛速度并改善分类效果。首先,在遗传算法中,采用把聚类中心作为染色体的符号编码方法,这种表示方法不但能使染色体编码长度变短,又能使交叉、变异后的搜索空间保持不变;其次,在进行选择操作时采用最优保存策略,保留遗传过程中适应度最高的个体,让它不参与交叉、变异操作而直接进入下一代,然后采用轮盘赌方法,根据适应度函数对应的概率分布选出合适的个体,并进行交叉和变异,以提高群体的平均适应度,保证每一代在进化过程中当前最优个体不会被遗传操作所破坏;最后,采用设定最大迭代次数和根据遗传收敛程度相结合的停止准则,减小误差并缩短遗传算法的运行时间。本文通过MATLAB进行实验仿真,使用IRIS数据集比较测试FCM算法、GFCM算法和文本提出的IGFCM算法的性能,证明了IGFCM算法能克服FCM算法中的初始化敏感的缺点,验证了IGFCM算法运行时间比GFCM算法短,最后讨论了该算法在文本聚类中的应用。
其他文献
基于Cantor集合理论描述现象非此即彼,无法处理具有模糊性和不确定性的信息与数据的情况,Zadeh[1]提出了模糊集理论,将取值仅为1或0的特征函数扩展为可在闭区间[0,1]中任意取值
在信息时代,税务部门向“微信息化”方向探索是优化纳税服务体系、提高行政管理效能的有效途径。“微信公众号”是能有效实现“微信息化”的工具之一,且操作简便,平台更开放
期刊
本论文由三部分组成,在第一部分,我们研究了一类2n阶差分边值问题,通过建立问题的变分结构.利用临界点理论中的变分法和山路引理,得到边值问题存在至少一个解或至少两个解的判别
本文主要运用 Nevanlinna 值分布理论和概率论的理论研究代数体函数及随机 Dirichlet级数.全文分三部分.首先通过一个实例,得出了代数体函数的分支点集与极点集之间无包含关系