基于粒计算的决策表属性约简

来源 :山东大学 | 被引量 : 0次 | 上传用户:lszh123321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着信息处理技术的广泛应用,使各行各业的电子化迅速普及,产生了海量数据信息,如何获取和发现有价值的信息并将其运用于生产实践中非常关键。因此,一个能够分析数据并且可以智能提取信息的研究领域--知识发现(Knowledge Discovery)应运而生并得到迅速发展,其中数据挖掘(Data Mining)成为当前知识发现的主要研究课题之一。 属性约简在数据挖掘或数据分析过程中有着重要的意义。一个信息系统或决策表可能有多个约简,而且约简后属性的个数将直接影响后续数据分析中规则模型的规模。人们希望找出信息系统或决策表的最小约简,但是求解最小约简已被证明是一个NP问题。 通过研究目前主要几种属性约简算法,发现多数算法选择从计算核心属性开始,按照各属性的重要程度逐渐扩大待求属性集,不同的属性重要度定义派生出不同的属性约简算法,主要有基于SkowronA的区分矩阵的属性约简算法;基于属性重要性的约简算法;基于信息熵的属性约简算法等方法。本文比较分析了目前几种主要不同属性约简算法的设计方法,在粗糙集和粒计算理论基础上,就如何实现信息系统和决策表基于属性重要程度的约简算法做了进一步研究。本文的具体工作如下: 1、提出了一种新的知识相对分布的度量方法。从粗糙集理论认为知识是区分事物能力的角度出发,利用属性之间具有不同区分能力的特点,给出一种新的度量知识的方法,其分布函数主要基于知识粒之间直观的分布变化,在此基础上提出了相对分布度的概念,用来考察属性间知识分布变化情况,之后分析了其合理性,并给出了相关性质。在相对分布概念的基础上,为了约简后产生具有更加确定性的规则,提出了联合相对分布度的概念。 2、提出了两种属性约简方法。一是在决策信息系统下基于相对分布度的属性约简算法。该算法利用相对分布度重新定义了属性的重要度,将属性重要度作为启发式信息,设计了相关约简算法。二是以联合相对分布度定义了属性重要度,并设计了相关约简算法。通过实例分析两种算法的特点及时间复杂度。 3、通过对标准数据进行了测试实验,研究了算法的执行效率;与同类算法相比较,分析了各自的优缺点,验证了算法的可行性和有效性。 最后,概括了本文的主要结果,说明本文工作的理论意义和应用价值,指出本文的不足和有待进一步解决的问题。
其他文献
运动人体的检测与跟踪不仅是运动分析和行为识别的重要内容,也是计算机视觉的研究重点之一。它在智能安全监控、高级人机接口、运动分析等方面有着广泛的应用前景和经济价值
社会网络已经逐渐成为人们在日常生活中不可或缺的媒介,所有用户都能通过社会网络获取和传播信息。具有影响力的用户能够加速信息的传播、快速地吸引大众的关注。识别有影响力
随着人们对软硬件系统功能需求的日益增加,导致系统的规模越来越复杂,其安全性和可靠性也越来越难以得到保证。在一些关键领域,例如航空航天、银行、证券等,软件可靠性问题显
传统GIS中的地理信息数据量大、地图数据格式种类繁多、结构复杂,而网络中的应用更需要轻量级的信息技术,因此,基于SVG格式的地图展示系统成为当前WebGIS的一个研究方向。本
医学计算机辅助诊断与医学影像系统的结合逐渐成为一个新的研究热点,它涉及几个交叉学科领域。因此,要实现一个医学影像辅助诊断系统是一个复杂的过程,它要求既要有丰富的医
随着互联网的快速发展,诸如电子商务、电子政务、办公自动化等数字化应用正在世界范围内迅速崛起。人们的生产、生活方式正发生着深刻地变革。但伴随着网络应用的迅速发展,网
电力市场的兴起为电网规划带来了许多新特点。建立电力市场的主要目的是通过在电力工业中引入竞争来打破电力系统的垄断,优化资源组合,提高电力系统的运行效率,使电力工业充满活力。在电力市场化的同时,也出现了一些问题。针对不同的电力区域机构关注的对象不同,因此各电力机构拥有自己的数据模式、数据组织结构不合理、数据冗余现象很常见。各个系统间的通用性很差,于是形成了电力部门之间拥有许多相互隔离的系统。本文分析了
学位
非真实感绘制(NPR)指的是利用计算机生成不具有照片般真实感,而具有艺术创作风格的图形绘制技术;而基于GPU的体绘制是利用现代可编程图形硬件的并行处理机制完成体绘制过程的
学位