论文部分内容阅读
模糊语言学主要应用于解决决策和聚类问题,本文主要研究基于模糊语言学中犹豫模糊信息的聚类技术。传统聚类技术分为硬划分和软划分,关于二者的研究都已相对成熟,而基于犹豫模糊信息的聚类技术是近几年开始逐渐成为热门的研究问题,因此,目前还存在许多不足,比如:用于描述模糊数据集的语言模型较老,无法实现对不确定信息的相对准确描述;涉及具有多个标准的问题时,针对权重信息缺失的情况缺乏应对措施,影响聚类结果的准确性;聚类过程复杂,效率较低等。因此,本文主要针对以上不足做研究,完成的主要工作如下:(1)针对所采用语言模型较老的问题,本文选取最新的语言术语集——概率语言术语集(PLTSs)作为研究对象,以提高对不确定性信息的表达能力。PLTSs不仅允许评估者提供多个语言术语,并且允许存在犹豫度,极大地包容了不确定性。相关系数是聚类的重要指标,因此,本文推导并证明了基于PLTSs的相关系数公式以及相关系数的上下边界和犹豫度。(2)针对权重信息缺失的问题,本文综合考虑了主、客观权重对聚类的影响,提出了标准权重确定算法,该算法主要包括计算由数据本身差异产生的客观权重、对主观权重进行标准化操作以及按照比例结合主、客观权重得到最终权重向量这三个步骤,可有效解决解决权重信息完全已知、部分已知和完全未知三种情况的问题。(3)针对聚类过程复杂、效率低的问题,本文结合当前最新的研究工作,提出了过程简单、效率较高的基于PLTSs的正交模糊聚类算法。算法涉及的主要步骤如下:首先,结合本文提出的标准权重确定算法与加权相关系数公式计算得到加权相关系数矩阵;其次,计算该相关系数矩阵的等价矩阵;然后,根据等价矩阵确定置信水平λ值,进而获得λ-切割矩阵;最后,根据切割矩阵内部列向量之间的正交关系来确定对应样本是否可以放在同一类别中,得到最终的聚类结果。文末通过实验对比和K-means聚类算法验证本文所提算法的准确性和高效性。