论文部分内容阅读
模糊聚类算法是数据挖掘的重要工具之一,在图像分割,参数识别等众多工程领域有着广泛应用。由于模糊聚类考虑样本的归属时有一定的模糊性,能更有效的反映客观世界,因此模糊聚类分析成为了数据分析的研究主流。本文从FCM和FCRM两种模糊聚类算法出发,研究并改进了这两种算法,并且把改进后FCM和FCRM算法分别应用于两种不同的工程问题当中。首先,通过以下三个方面对FCM算法进行研究:(1)研究了基于高斯核函数的FCM算法,该算法使用核函数代替FCM算法中原有的欧式距离,从而减弱相似特征的影响被放大的问题,进而提高聚类效果并加快了迭代速度。但是,这种方法的m模糊加权值为固定值,无法反映出样本数据结构的不同;(2)由于FCM聚类算法处理多重不确定性数据的能力不足,研究了将FCM算法从一型模糊集合扩展到二型模糊集合的算法,并对二型模糊集合进行了简化及算法优化。但是这种方法无法和现有的数据进行信息沟通;(3)为了使不同数据站之间可以进行信息交流,本文研究了协同思想和FCM相互结合的方法,利用协同聚类算法使不同特征子集之间的数据结构相互沟通影响,从而提高了该类型数据的聚类效果。由于以上算法均存在一定的缺陷,本文提出了基于高斯核函数的协同区间二型模糊聚类算法,从而达到更优的聚类效果,并通过仿真实例证明新算法的有效性。其次,针对传统的FCRM算法虽然可以对输入输出数据的回归模型进行有效聚类,但是对离群点和不确定的输入数据敏感,容易引起聚类结果不准确的缺点,本文研究了一种具有鲁棒性的FCRM算法,该算法通过引入容差的概念来提升该算法处理数据不确定性的能力。并且通过研究发现,以上两种FCRM算法法在求解过程中,采用的最小二乘法可能导致求解参数矩阵无解的情况。针对这两种算法在求解过程中不稳定的问题,本文提出了一种基于LM算法的改进模糊C回归聚类算法,使用LM算法代替原有的最小二乘算法,保证FCRM算法的收敛。最后,本文分别将基于改进的FCM算法和FCRM算法应用于两种不同的工程实际问题。将改进的FCM算法应用于热点检测过程中的聚类步骤,相对于原有FCM算法,取得良好的聚类效果。然后,在单晶硅位错动态特征提取的应用中,通过基于LM的FCRM算法对拉晶过程中的单晶硅直径数据进行数据挖掘,得出了反应位错信息的相关维度,该算法相比原算法具有较高的稳定性。