基于属性值权重的k-modes聚类分析及应用

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:zd013wyt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中的重要研究内容之一,其主要任务是将数据对象根据某种相似准则划分成多个簇,同一个簇中的对象之间具有较高的相似性,而不同簇中的对象具有较大的相异性。k-modes聚类分析作为一类分类数据聚类分析方法,存在着距离度量不够准确,并且初始中心点的选取缺乏稳定性,严重影响聚类分析效果。本文采用属性值权重,对k-modes聚类分析中的距离度量、初始中心点选取及应用进行了深入研究。其主要研究成果如下:(1)给出了一种基于属性值权重的k-modes聚类分析算法。该算法在计算数据对象间的距离时,结合属性值在数据集中的分布特征与属性值自身的差异,重新定义了分类数据相异度度量公式,有效地解决了属性值之间的差异性度量;利用属性值频率和各属性值的权重,给出一种聚类中心更新途径,并给出了一种基于属性值权重的k-modes聚类分析算法;在UCI数据集上,实验验证了该方法能够有效地提高聚类分析的效果。(2)给出了一种基于距离和离群度的k-modes初始聚类中心点选择策略。该策略利用属性值权重,定义了数据对象离群程度度量公式,结合数据对象与已选中心点之间的距离,选取距离相对较远且离群度较低的数据对象为初始中心点。采用UCI数据集,实验验证了该策略的有效性。(3)依据上述的研究内容,采用python语言,设计与实现了基于k-modes的天体光谱数据聚类分析原型系统,并对其相应的功能图和软件系统结构等,给出了较详细描述。运行结果表明该原型系统可为天体光谱的知识发现,提供了一种有效的途径。
其他文献
学位
学位
学位
学位
学位
学位
学位
机械加工过程中刀具状态异常检测可以保证刀具加工的安全性与稳定性,传统的刀具数据检测方式较为单一,使用的是工业上传统的3sigmod方法进行计算,得出异常数据,之后进行处理。这样的处理方式可能会延长检测时间,进而使得刀具寿命变短,磨损更加严重,如何将刀具异常数据用人工智能的方法进行检测成为加工过程中刀具状态检测的关键。本文针对刀具数据的特点,提出了基于LSTM的刀具单序列数据的异常检测以及多维刀具数
学位
学位