基于ρ-δ决策图的模糊C均值聚类方法研究

来源 :武汉科技大学 | 被引量 : 1次 | 上传用户:liongliong564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊聚类是对没有标签的数据集进行有效划分的重要手段之一。随着大数据时代的到来,数据量呈指数增长,然而大多数数据是没有标签的,如何将这些数据准确分类,并为用户提供更准确的服务成了当今社会重点研究的方向。模糊C均值算法(FCM)是一种基于目标函数的模糊聚类算法,与典型的“硬聚类”算法(如k-means算法)相比较。FCM算法计算每个样本对所有类的隶属度,得到更可靠、准确的分类结果。然而,在聚类过程中,FCM算法需要人工确定聚类数目,并且对初始聚类中心敏感。容易产生多聚类迭代、收敛速度慢、局部最优解等问题。为了解决这些问题,本文提出将FCM算法与决策图相结合的算法(DGFCM)。首先利用决策图自动选择聚类中心和聚类数目,然后利用FCM算法实现聚类。本文首先综述了国内外关于改进FCM算法的研究方法,根据目标准则函数阐述了5个方向的FCM算法的改进;其次,通过实验证明了初始聚类中心对FCM迭代次数和聚类结果存在较大影响;再详细介绍了基于ρ-δ决策图的模糊C均值聚类方法;最后,分别采用UCI真实数据集和人工数据集作为实验样本数据,运用传统FCM聚类算法、快速密度峰聚类算法(DPC)、DGFCM算法进行聚类,计算三种聚类评价指标,分别比较其聚类效果。对比实验表明,改进的FCM算法具有较快的收敛速度和较高的精度。
其他文献
新型非易失存储技术有望取代传统内存成为下一代主存,将其应用于内存系统中仍然面临着数据安全问题带来的挑战。采用传统的计数器模式加密、完整性检测等机制保证非易失内存的数据安全会对数据访问性能、存储介质寿命带来严重影响。采用可变形计数器组织方式管理数据加密计数器,提出了一种高效的完整性检测树组织方案Co-Counter。Co-Counter减少了额外的访存开销,将每个数据块的加密计数器、局部计数器等元数
固态硬盘因为其性能高,能耗低等特点,正在逐步地替代传统的硬磁盘,被广泛地应用于存储系统中。但是闪存存在着寿命有限的缺陷,用固态盘构建的大规模存储系统存在着可靠性问题,固态硬盘阵列可以利用冗余校验提高系统的可靠性。但是,由小写引起的奇偶校验更新引入了大量的读写操作,降低了系统的性能,缩短了固态盘的寿命。针对固态盘阵列的小写问题,现有方案通过挖掘访问关联的热数据,将它们重组到新条带,减少校验更新开销,
随着经济全球化和国际生产体系的不断发展,基于产品内国际分工的中间产品贸易迅速发展起来并成为国际贸易的主要方式。我国利用劳动力成本优势积极投身于中间产品贸易,因此研究中间产品贸易与我国劳动力需求的相关问题具有极强的现实指导意义。本文基于2005-2016年我国31个工业行业的面板数据,从劳动力需求总量及劳动力需求弹性两个方面考察中间产品贸易对劳动力需求的影响,并重点考察中间产品贸易引致的技术进步对劳
为贯彻《预算法》(现代“经济宪法”),国务院从国家层面制定并下达了2014-2020年间每年学校预算编审下达执行决算等具体任务目标,并稳步推进。根据国家的要求,研究并开发具有本单位特色的预算管理系统,对于依法治校,财务管理能力提升意义重大。本文以云南民族中学预算管理系统的开发为研究背景,分析学校传统的业务流程,研究目前通用预算管理软件存在的问题等,提出优化业务流程方案,并用活动图描述。在用例分析和
随着计算机技术的发展,计算机辅助诊断系统(computer aided diagnosis CAD)对于病理分析及癌症诊断具有重要的意义,己广泛应用于肺病的早期筛查,它一般步骤通常包括图像的预
氧化铟是一种重要的n型半导体材料,禁带宽度较宽(2.30~3.75 eV)、具有良好的导电和导热性能,被广泛应用在气体传感器和光电催化等研究领域。科研工作者为了改善单一氧化铟的气
深度报道《草根防艾路》,关注了瑞丽市草根防艾组织——惜景家园,在乐施会支持下于2008年-2018年之间所开展的工作。报道以2019年四月乐施会撤出为契机,探讨国际组织援助下的草根组织,在十年间开展防艾工作中的成效和遗留问题,并分析现有的政府购买服务所存在的问题以及未来的发展。报道以惜景家园工作人员岚姐和几位感染者的故事展开,辅以乐施会项目活动的内容,撤出原因等背景,深入报道国际资金撤出后,草根防
近年来,物流在国际贸易活动中发挥着越来越重要的作用。物流教科书由业界专家和资深编辑联合编写而成,是系统物流学科知识和专业物流语言表达的有机结合,有助于学习者在学习物流行业学科知识的同时掌握纯正物流语言表达形式。然而,当前对物流教科书语言的研究还很少。因此,本文基于自建物流教科书语料库,借助语料库研究方法,从短语学和语域理论视角探讨物流教科书语言特征。主要研究问题如下:1)物流教科书经常使用哪些词?
高校学生行为数据是一块值得挖掘的瑰宝。通过对高校的学科专业建设、人才培养、学生管理、校园服务等各种实践活动中产生的学生行为数据进行整合管理和数据分析,可以对学生
电阻抗层析成像技术(Electrical Impedance Tomography,EIT)是一种无损功能图像重建技术,在医学、工业等诸多领域都具有广泛的应用前景。EIT技术主要是通过对被测物体施加一