决策粗糙集的属性约简算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zhuxuxu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是率先由波兰数学家Pawlak在上世纪末提出的,主要针对的是分析不确定性问题。粗糙集理论中的一个重要的基本概念是属性约简,也是一个最基本问题,但是给出高效的属性约简算法是很重要的也很困难的问题,在现实应用中,具有十分重要的研究意义。近些年来,研究学者们相继提出了一系列的诸如变精度粗糙集模型、概率粗糙集模型等粗糙集模型,它们是建立在传统的Pawlak粗糙集模型基础之上的,加入概率的方法而形成的。这些研究大大的提高了我们对粗糙集理论的理解和延伸了粗糙集理论的应用领域。基于分类的粗糙集获得的结果可以用来制定决策。在传统的Pawlak粗糙集模型和概率粗糙集模型中,都具有正域规则和边界规则这两种不同的分类规则,它们会导致不同的决策序列。其中,正域规则是指一个对象或者一个对象集能够确定属于或者超过一定阈值范围时是属于某一个决策类的,边界规则是指一个对象或者一个对象集是部分属于或者超过另一阈值范围时是属于某个决策类的,它将会导致另一类的决策。它们可以用支持度、损失函数等方法来评估,这种分类规则使我们不仅能够对单个规则施以局部评估,而且可以对整个规则集施以整体评估。本文首先概要的介绍了粗糙集理论的相关概念及其理论知识,分析了粗糙集理论的特点及其研究现状;其次简单介绍了传统的基于属性重要度、基于分辨矩阵、以及基于信息熵的属性约简算法的基本思想和算法过程,粗略的比较了它们的优缺点以及适用情况,描述了传统的Pawlak粗糙集模型和概率粗糙集模型这两类粗糙集模型的基本知识;论文主要工作有(1)在传统粗糙集模型的基础上,引入了贝叶斯决策过程,从而建立了一种决策粗糙集模型,它是基于损失函数的,给出了利用损失函数以及最小化期望损失来获取阈值,也就是说,是基于更加实际的风险和成本的,这样有利于我们对粗糙集理论的理解和拓展了其应用领域。(2)针对决策粗糙集模型中,正域不一定是单调的这一特性,我们分析了在给予一定条件加以限制正域使其具有单调性的情况下,对知识系统进行基于属性重要度的属性约简算法分析,以及将其同对传统的粗糙集模型进行属性约简算法结果进行比较分析,从而证明该模型的有效性,并且能够看出基于正域的约简算法具有较好的约简结果;(3)最后对两种不同的粗糙集模型,我们从支持度,损失等不同的方法对获得的规则进行简单的评估,从而更加使得我们获得的规则使我们真实想要的。
其他文献
随着网络日益普及和使用电子商务平台进行购物的用户越来越多,电商的商品种类和信息也越来越庞大,海量的商品和平台信息往往消耗掉网购用户大量的时间和精力进行查找商品或检索
为了便于人眼视觉观察和后续计算机分析处理,图像复原和图像增强能够突出图像中的部分细节信息。由于存在大气粒子的作用,雨雾天气时,空气中充满着小水珠,各种图像实物的反射
随着互联网技术的迅猛发展,图片获取和传播途径的日益宽广以及图片存储能力的不断提高,使得海量图像数据库成为人们获取和检索图像的主要对象。如何从这些海量图像数据中获取具
卫星舱布局设计(SMLD)属于3D带性能约束的组合优化问题。求解此类问题时,需将三维卫星舱部件简化成圆柱体和长方体。当各部件竖直放于承载板时,该问题可以转化成2D带平衡约束的
离群点挖掘已成为数据挖掘研究领域最活跃的分支之一。在数据库、数据挖掘、机器学习和统计学等领域受到广泛关注,在欺诈检测、入侵检测、故障检测、生态系统失调、公共卫生中
随着我国经济的迅猛发展,各地化工企业不断增多,各地方政府为了对化工企业更好地进行管理,通常将大量的化工企业集中到化工园区。化工园区在促进地方经济发展同时,同时安全和环境
同时定位与地图创建是指机器人在进行自身定位的同时创建增量式地图,并根据创建的地图来更新自己的位姿。作为移动机器人智能导航研究的重要基础和关键技术,过去十几年中SLAM问
行人检测一直是计算机视觉领域中热门问题之一,虽然经历了几十年的发展,但仍然有很多需要解决的问题。作为计算机视觉的基础问题之一,它的性能往往会制约更高层次的计算机视觉问
近年来,频繁出现危害公共安全的事件,智能视频监控作为公共安防领域中核心的技术之一,已成为人们密切关注的焦点。但是,目前的许多学者都是在理想的条件下进行的,并没有考虑到算法
现在,并行计算的平台绝大部分是分布式并行系统。分布式并行系统能否快速有效处理并行计算,除了依赖于分布式并行系统性能、网络带宽、并行算法等,还与任务分配和调度顺序有