【摘 要】
:
粗糙集理论是波兰数学家Z. Pawlak提出的一种可用于处理不精确性、模糊性和不确定性的有效的数学工具。其特点是在无先验知识或者附加信息的情况下处理数据。粗糙集在数据挖
论文部分内容阅读
粗糙集理论是波兰数学家Z. Pawlak提出的一种可用于处理不精确性、模糊性和不确定性的有效的数学工具。其特点是在无先验知识或者附加信息的情况下处理数据。粗糙集在数据挖掘、知识约简等方面有很好的应用前景。属性约简是粗糙集理论的核心内容之一,其能够在保证系统分类和决策能力不变的前提下对数据库中的冗余属性进行约简,简化知识表示,提高系统处理的效率,方便用户决策。由于信息系统在对象、属性变化时,需要得到更新后的信息系统的属性约简,这样,对于增量式粗糙集属性约简算法的研究慢慢开展开来。本文通过对增量的粗糙集求核以及属性约简算法进行深入研究,主要的研究内容如下:(1)提出了一种改进的基于正区域的决策表增量属性约简算法。首先计算原决策表与增量决策表的等价类、核、正区域等信息。其次通过分析,原决策表以及增量决策表的等价类与新决策表的等价类关系,得到新决策表的等价类;分析原决策表的正区域信息,增量决策表的正区域信息,得到新决策表的正区域等信息。最后根据上述的条件作为基于正区域的决策表求核。在新决策表核属性集合的基础上,使用属性重要性算法对决策表进行属性约简。(2)提出了一种改进的基于信息熵的决策表增量属性约简算法。首先将决策表划分成多个小的同构的决策表,然后对各个同构决策使用基于信息熵的算法求核,最后通过对原决策表与各同构决策表在属性约简之间核,等价类等的关系,整合得到整个决策表的属性约简。
其他文献
随着信息技术的发展,文本资料的数量呈几何级增长,如何在众多的资料中快速准确的找到人们需要的信息,成为当前信息处理领域一个亟待解决的问题。基于人工智能的文本分类技术
离散事件控制系统(DECS)是离散事件在控制系统的一个分支,广泛存在于工业控制系统中,是一类复杂的人造系统。规则化描述方法(RDM)采用程序与数据相分离地方式,为DECS建模和实
随着网络和信息技术的快速发展,各个行业已经建立起基于广域网络的、分布式业务信息管理体系,它的应用范围不断地扩大,在行业内部,业务信息由基层单位采集,逐级汇总,行业之间也存在
棉花是一种重要的生产原料,许多行业领域都需要使用其加工制品,而棉花内混杂入异性纤维会造成棉花的加工制品质量下降,不仅带来的巨大的经济损失,还会影响我国在国际市场的棉
随着生产技术的发展和生产过程的日益复杂,为确保生产装置安全、高效地运行,开发一套适合于生产过程的实时监控组态软件系统越来越重要。本文在对监控组态软件的技术、特性以
信息技术的高速发展让校园网已经成为高校教学和管理中的一个不可缺少的部分,校园网的应用对高校的建设和发展起到了很大的促进作用。校园网良好的运行、网络用户方便有效的
石油钻井过程中需要使用大量种类和型号繁多的钻具物料,传统钻井物料管理信息系统主要是对钻井物料使用的事务性信息进行管理,缺少对钻井物料使用信息的分析和决策支持,未充
随着多媒体技术和Internet技术的迅速发展,网络上的视频数据增长迅猛,如何对视频数据进行有效的内容监管和版权保护,对视频进行拷贝检测就成为亟需解决的问题。本文主要设计
物联网随信息技术进步发展迅速,融入社会各方面,悄然改变着人们的日常生活。IEEE 802.15.4标准出现、6LoWPAN工作组的成立,使无线嵌入式网络成为可能,促进了物联网的发展。WS