论文部分内容阅读
聚类分析是数据预处理的一种重要工具。作为一种无监督分类方法,它已经被广泛地应用于模式识别、数据挖掘、计算机视觉和模糊控制等许多领域。模糊聚类由于能够描述样本类属的中介性,能够客观地反映现实世界,已逐渐成为聚类分析的主流方法之一。在众多的模糊聚类算法中,模糊c均值算法(FCM)可以说是应用最为广泛、最为灵敏的一种算法。模糊c均值算法是模糊聚类分析中一种基本的划分方法,通常该方法采用误差平方和准则函数作为聚类有效准则。模糊c均值算法表现出很多优点:算法简单、解决问题的范围广、快速而且能有效地处理大型数据库和高维度数据,还可以转化为优化问题而借助经典数学的非线性规划理论求解,并易于计算机实现.因此,随着计算机的应用和发展,基于目标函数的模糊聚类算法成为新的研究热点。
本文通过对FCM聚类算法的运行机理进行系统的分析,在模糊c均值算法中目标函数是基于欧氏距离的基础上,针对这个问题,从以下方面对FCM聚类算法进行了改进。主要工作包括:
第一,首先,本文概括介绍了聚类分析和模糊聚类分析的基本原理。聚类分析就是无监督模式识别中的一个重要分支。聚类分析的基本思想是根据物以类聚的原理,对样本进行分类。其次,介绍了聚类分析的数据类型和已有的模糊聚类有效性函数以及模糊c均值算法并指出了模糊c均值算法存在的问题。
第二,将传统的的模糊c均值算法中目标函数是基于欧氏距离(即L2)改为用一种新的距离来刻画目标函数,在此基础上,通过实验说明了基于新距离的目标函数的模糊c均值算法的可行性与有效性。