基于信息熵的属性约简算法研究与实现

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:shibaotuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性约简是粗糙集理论研究的重要内容之一,是在保持信息系统分类能力不变的基础上,删除冗余属性。为了获得决策系统中属性最小相对约简,将信息论应用于决策信息系统属性约简中,并与遗传算法相结合,提出了一种改进的属性约简启发算法,讨论了启发信息的构造。通过两个例子证明了基于属性依赖度的属性重要度和基于信息熵的属性重要度的不完备性,提出了一种加权平均的属性重要度,并将其作为约简算法的启发式信息,对知识进行量化,证明了量化的合理性,并以量化后的区分能力作为启发式信息指导约简,提高了约简效率。另外利用这种启发式信息提出了一种改进的基于核子集的属性约简算法,其中根据知识量对遗传算法中的选择算子进行了改进,使得算法可以得到多个约简,同时通过知识量改进了算法的结束条件,改变了传统的遗传算法用设定迭代次数作为结束条件,提高了算法的效率。
其他文献
随着工业技术的发展,在人-机-环境这个系统中,人的因素越来越引起大家的重视。人的因素已经成为工业产品设计的主要因素甚至决定因素,在设计及产品的测试过程中需要“以人为
随着计算机技术的飞速发展,计算机已经逐渐成为人们生活不可或缺的一部分,与此同时,恶意软件的数量在迅速增长,其反分析、反检测技术也不断增强,这给安全软件的设计和实现提出了更
本文介绍了文本分割的历史发展和现状,对当前文本分割领域的主流方法进行了讨论,并结合文本分类任务对文本分割任务中所存在的问题及典型的解决方案进行了介绍。因为统计模式
本文通过理论分析加以辅助实验,围绕Web使用挖掘中的几个主要问题进行了研究。  本文首先对Web使用挖掘中各个阶段进行了全面的分析,尤其对数据预处理中用户会话和用户事务的
现今我们正处于一个信息速增的时代,每日有数以PB计的数据在网络上传输与处理。然而,在这些数据中,除了传统的文本数据之外,图片和视频等多媒体数据也受到越来越多用户的青睐
能源竞争已成为当代国际竞争的重要内容,随着我国国民经济发展和对能源行业的更加重视,石油工业被推到了极其重要的战略位置。信息技术的应用对于提高石油行业勘探开发、数据
本文首先介绍了G.726语音编解码算法的在PC机中的编程实现以及在目标板上的移植。此算法也是H.323标准中语音算法的一种。 其次本文介绍了一个基于H.323的网守总体设计与
人脸识别是模式识别研究领域的重要课题。在过去几十年,人脸识别的研究更多地停留在理论意义之上,自20世纪80年代末90年代初以来,随着信息安全的重要性日益突出,人脸识别技术
针对地理信息系统对矢量化电子地图的需求,本文设计并实现了纸质地形图矢量化系统。本文用数学形态学相关理论方法实现了对扫描图像的分割,并且对具有同一线型但不同线宽的线状
集成学习方法能够将原本表现一般的弱分类器集成起来,显著地提高学习系统的泛化能力,从而得到更好的预测精度。同时由于集成学习方法具有灵活的适应能力,它已经被成功地应用