聚类分析中的特征选择研究

被引量 : 4次 | 上传用户:lingang89029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是机器学习和数据挖掘中的重要工具,在发现数据中的隐含知识和识别数据内在结构方面有着重要的作用。迅猛发展的计算机技术、网络技术和数据库技术使得数据的采集、传输和存储更为便利和快捷,从而形成了大量类型复杂、结构多样的高维海量数据,其带来数据结构的复杂性使得当前特征选择算法和机器学习算法难以收到较好的结果,迫切需要发展适应大规模数据的准确性和运行效率等综合性能较好的、新的特征选择算法以及机器学习算法。因此,为了有效的进行模式分类和聚类分析,特征降维就显得尤为重要。本文针对大规模数据聚类分析中的特征选择方法研究开展了较为深入的研究,主要内容如下:(1)针对当前大规模数据处理中遇到的问题进行分析,对当前在聚类分析中的特征选择算法进行总结分类。针对特征和类别之间的关系,引入一种邻域度量方式,给出了一个度量特征聚类能力的评价指标。(2)针对分类型数据,运用新的特征评价指标,结合启发式搜索策略,提出了一种特征选择算法,通过与传统的聚类分析算法进行了比较和分析,证明特征选择算法在提高聚类精度和降低时耗方面是可行和有效的。(3)将提出的特征选择方法应用到半监督聚类分析中,通过与传统的聚类分析方法进行对照分析,在提高聚类精度和降低时耗等方面验证了算法的有效性。本文取得的成果进一步发展了无监督领域中特征选择的研究,也为解决高维复杂数据的聚类分析等实际应用问题提供了新的方法和视角。
其他文献
滚-摆式导引头框架角大,结构紧凑,能够实现对前半球视场的覆盖。但是其特有的过顶跟踪问题,即在小离轴角对目标跟踪时会产生奇异这一点制约了滚-摆式导引头的应用。针对滚-摆式
托马斯·哈代是英国维多利亚时代和新时代交界线上的伟大小说家和诗人。他的小说《无名的裘德》是最受争议的一部作品。作品内容涉及社会和人们生活的许多方面,展现维多利亚
目的:探讨中医综合护理对胰腺癌患者生活质量的影响。方法:将2015年9月17日-2017年5月5日期间我院收治的120例胰腺癌患者分为两组,对照组60例,给予其常规护理;观察组60例,给予
《咒语》是美国著名后现代作家库特·冯内古特的代表作之一,小说以主人公越战退伍老兵哈特克内心独白的方式展开。哈特克回忆了自己的一生,向读者讲述了越战的荒谬及越战老兵的
在信息高度发达的新时代下,各国政府都越发注重政府信息公开问题以保证政治制度的透明性和先进性。我国也不例外,自从《中华人民共和国政府信息公开条例》实施以来,取得了一定成
本文对多种螺旋压力机机身结构进行了分析研究,首先通过对机身有限元模型的建立,讨论了机身的预紧方法和边界条件。以有限元方法为基础,按照螺杆运动形式,对几种典型结构机身从结
国内外越来越多的知名建筑院校已经开展建造实践并将其纳入建筑设计课程体系,在建筑设计教学阶段贯彻建造教学,通过实际的建造体验活动来触发学生对建筑的理解与认识已经变得
本论文采用密度泛函方法对SP~2杂化的碳芳基自由基的分子内环合成反应机理进行了理论研究,研究体系包含N-甲基-N-(N-甲基吲哚酰)-2-苯胺自由基、N-甲基-N-呋喃酰-2-苯胺自由基
福柯的理论看似松散、不成体系,其实主体一直是他研究思想中的主轴。对社会真理、权力、道德的批判都围绕着主体进行展开。首先,本文从福柯的生存美学的背景入手,对生存美学“关
洪洞、大槐树、老鹳窝,家祠、牒谱、地方志,家、家族、民族,汾河、黄河、黄土地构成了洪洞大槐树精神家园的文化符号。这些文化符号伴随着明代洪洞大槐树的移民影响了中国北