K-均值聚类算法的研究与改进

被引量 : 77次 | 上传用户:beyond870402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞快发展,人们每天都会面临诸如文本、图像、音频、视频等各种形式的数据,这些数据的数量是极其庞大的,如何快速有效地从这些海量数据中提炼出其间所隐含的有价值的信息,成为人们十分关注且亟待解决的问题。数据挖掘(Data Mining,DM)由此而诞生。它为人们解决这个问题提供了许多卓有成效的方法和工具。聚类分析就是其中最为重要的方法之一,它是数据挖掘技术的重要组成部分。随着近年来对聚类分析技术的研究逐渐深入,其重要性已越来越得到人们的认可。近年来,无论在理论方面还是在实际应用方面,聚类分析技术的研究都取得了丰硕的成果。目前,聚类分析技术已在机器学习、模式识别、图像处理、文本分类、市场营销及统计科学等领域得到了广泛的应用。根据数据类型、聚类目的及应用的不同,目前已有的聚类算法大致可以分为以下几种:划分的算法、层次的算法、基于网格的算法、基于密度的算法以及基于模型的算法。其中,研究最为成熟最为经典的就是基于划分的K-均值聚类算法。本文深入研究和分析了K-均值聚类算法的优缺点,并针对其聚类结果易受初始中心影响的特点,对K-均值聚类算法进行了改进。本文所做的主要工作有:1.针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,本文提出一种新的选取K-均值聚类算法初始聚类中心的方法,实验表明,该方法可有效解决由于初始聚类中心选取的过于邻近而导致聚类结果不稳定的问题,提高了聚类结果的有效性和稳定性。2.针对K-均值聚类算法存在对初始中心的选择敏感且易陷入局部最优解的缺点,本文将全局寻优能力强的差分进化算法引入聚类中。本文提出了一种改进的差分进化算法,并将改进的差分进化算法和K-均值聚类算法相结合,较好地解决了K-均值聚类算法初始中心的优化问题,实验表明,该方法有效提高了聚类质量和收敛速度。
其他文献
战国时期秦国刑罚具有独特的个性。这种独特性既体现在秦国的刑罚体系上,又体现在刑罚的宏观执行上,还体现在刑罚对社会的影响上。秦国刑罚体系庞杂,种类繁多。死刑和肉刑构
本研究运用案例分析法、数据分析法和文献分析法,以南通市如皋县薛窑高中为例,对语文“活动单导学”模式进行了较为深入的分析。首先从“活动”、“活动单”和“导学”三个核
贴面压机工作时,热压板上的八个油缸向贴面压机提供压力。对八个油缸的布置形式所产生的影响进行了理论分析,并应用多点约束算法进行有限元分析。通过分析,对八个油缸的布置
超高韧性水泥基复合材料(Ultra High Toughness. Cementitious Composites,简称UHTCC)是一种新的乱向短纤维增强的高性能水泥基复合材料,具有拉伸荷载作用下的应变硬化特性和
在新课改进入了“以增强效能”为重点的阶段以后,高效教学自然成为广大师生关注的重点,而课堂是实现高效教学的主阵地,课堂教学有效研究是当前高中新课程改革的核心问题之一
目前,近代汉语副词研究成为近代汉语语法研究的一个热点,各类专书的研究层出不穷。2005年,杨荣祥先生出版了国内第一部近代汉语副词研究的专著——《近代汉语副词研究》,对近
制度是塑造制度体制内相关主体行为的“一种关键性、干预性变量”,实现对行动者的约束。然而,约束实现的高度系统性制度环境与我国低制度化的现实环境存在明显的“错配”,导
随着我国教育发展进程的加快,对教师综合素养水平有了更高的要求。就学前教育而言,社会教育机构有必要积极培养和输送学前教育专业的教师人才,以提高教学综合能力,使其更好的
针对水平井压缩式裸眼封隔器存在的密封性差、坐封力低、胶筒与井壁间存在间隙等问题,对其密封结构进行改进与优化,设计出一种凸球形隔环和凹球形胶筒组相结合的新型密封结构
公共租赁房在国内属于新兴的保障性住房模式,谁建、怎么建、谁住、谁监管、怎么退出,都需要探索和逐步实施。本文围绕重庆市公共租赁房建设历程,从以下几个方面对重庆市公共