一种改进的COBWEB算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yluylu2k
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘中的聚类分析一直是近年来应用极为广泛的技术之一。所谓聚类,是物理或抽象对象的集合分成由类似的对象组成的多个类的过程。而随着信息技术的发展,数据的形式也逐渐多样化,很多数据集中都包含有不确定的属性,这类数据被称为不确定数据。在生物、医学等领域,这种不确定数据更为常见。传统的模型聚类算法并不能提供一个有效的方法来处理此类数据。本文针对经典的COBWEB算法,给出了一种基于不确定数据的聚类算法来解决原算法不能处理不确定因素的问题。本文首先分析研究了数据挖掘的相关理论与技术、数据挖掘中聚类分析一般步骤和经典算法,特别针对基于模型的聚类算法进行认真研究和分析。其次,在认真研究了原COBWEB算法的基础上,就其在应用过程中存在不能处理不确定数据的问题,给出了一种改进算法。改进算法以不确定数据作为输入源,采用经典的信息熵、欧氏距离和相似性度量理论改进了原算法的分类效用函数,新函数对于实例有更全面的解释和表达,同时也模型化了新分类树。最后通过仿真实验来对比两种算法,结果表明新算法能够有效地处理不确定数据,而且在不降低时间复杂度的基础上提高了聚类的质量和聚类准确率。
其他文献
知识工程是人工智能的一种实现方法,对那些需要专家知识才能解决的应用难题提供求解的手段,它在中医学领域中的应用方兴未艾。本文介绍了浙江大学CCNT实验室与中国中医科学院
覆盖控制作为无线传感器网络(Wireless Sensor Networks, WSN)中的一个最基本的问题,是衡量无线传感器网络工作性能的重要评价指标。它不仅使WSN的空间资源得到优化,而且影响
本体作为一种能在语义和知识层次上描述知识系统的概念模型和建模工具,自被提出就引起了国内外众多科研人员的关注,并在计算机的许多领域得到了广泛应用。但是本体的构建研究
在织物染色配色问题研究中,由于染料本质的问题,本文中提出两种不同的解决问题的思想,并且建立了两种模型。第一种方法采用数学建模方法,主要针对三种染料与三刺激值之间关系
模型驱动架构(MDA)是对象管理组织(OMG)提出的一种新的软件开发框架。与传统软件开发不同,MDA以模型为中心,使用模型来指导系统的设计、开发和维护。它将模型和实现技术分离,
FPGA技术已经取得了巨大进步,FPGA芯片在容量和速度上都达到了较高的水平,现在已经有许多学者研究如何使用FPGA完成对应用程序的加速。Deflate算法是无专利保护的可以自由使用
深度学习是人工神经网络的新技术进展。深度学习在若干领域已经突破历史记录,提高准确率和缩短收敛时间依旧是神经网络追求的目标。人脸识别作为深度学习的一个成熟的应用领
传统的嵌入式语音识别系统存在结构复杂、硬件要求高、灵活性和鲁棒性差以及词库更新难等不足。本文从网络应用的角度研究了基于HMM的分布式汉语语音识别系统的相关技术,包括
大气自然偏振特性蕴含罗盘方位信息,利用自然偏振特性的仿生偏振光导航是一种新型自主导航方法,是弱/无卫星环境下导航研究的一个重要尝试。因此,仿生偏振光导航及由其构成的