基于信息熵的粗糙集约简与支持向量机相结合的分类问题研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:ice_city_82
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的快速发展,各行各业涌现出大量的数据信息。如何从这些数据中快速获取有用的知识、提取有效的分类方法是目前机器学习面临的主要问题。粗糙集理论方法是一种能有效地分析和处理不精确、不一致、不完整等各种不确定信息的数据分析工具,已经成功应用于机器学习、模式识别、决策支持、知识发现、故障诊断等领域。知识约简作为粗糙集应用的关键技术,是该理论的核心问题之一,能够对数据进行快速有效的处理。Vapnik等人提出的支持向量机是一种新的机器学习理论,集成了最大间隔超平面、Mercer核、凸二次规划、稀疏解和松弛变量等多项技术,其主要借助于最优化方法来解决机器学习问题。由于该理论具有全局最优、结构简单、推广能力强等优点,近些年得到了广泛地研究并被应用于数据分类、模式识别等领域。由于大多数的多类分类问题最终都可以转化为两类分类问题,因此支持向量机的原始问题也只涉及两类分类问题。通过对以上两种理论的学习研究,结合它们的优点,设计了一种基于信息熵的粗糙集约简与支持向量机相结合分类算法,并将该算法应用到本文的分类系统中,实验结果显示该算法在分类的准确率和速率方面都有所提高。本文主要工作如下:1.通过对粗糙集约简方法的研究,选择基于信息熵的启发式约简方法作为本文所提算法属性约简的工具。2.在粗糙集区分矩阵的基础上,提出一种新的粗糙集对象约简算法。3.设计了一种基于信息熵的粗糙集约简与支持向量机相结合的分类算法。该算法采用粗糙集属性约简理论对支持向量机数据特征进行选择,能有效降低输入特征向量的维数;而且,根据本文提出的对象约简方法能够有效移除冗余信息,修正不一致的信息,从而使分类面的分类性能得到优化。4.通过对UCI数据库中数据集进行的研究和实验,验证了文中设计算法的有效性。
其他文献
离群点挖掘由于其在检测金融欺诈和网络入侵、疾病预防和控制、灾害气象预报等许多方面的广泛应用而成为数据挖掘领域中的一个重要研究方向。随着研究的进行,大型、低维数据
随着互联网相关技术的高速发展,数据量以指数级增长。如何从这些海量数据中获得有社会价值和商业价值的信息成为当前急需解决的问题之一。聚类分析是指在无先验知识的情况下,
医学图像处理是计算机领域的一个分支,是数字图像处理技术在生物医学工程中的重要应用。在计算机辅助检测系统中,准确、有效地从X射线胸片中分割出肺组织是关键和必须的步骤
在过去的几十年里,我们目睹了世界许多地方的人口预期寿命稳步增长,导致老人的人数急剧上升。最近联合国报告预测,到2050年,世界上将有20亿老年人,占世界人口的22%。此外,研
随着物联网技术研究的不断升温和应用的不断深入,物联网现已成为继计算机、互联网与移动通信网之后的世界信息产业第三次浪潮。本课题是在物联网蓬勃发展的背景下,从某特种货
布谷鸟搜索算法是由英国剑桥大学学者Xin-She Yang和Deb Suash于2009年受布谷鸟寄生繁殖行为的启发模拟提出的一种新兴启发式优化算法。与许多启发式优化算法相比,布谷鸟搜索
水稻是我国主要粮食作物之一,水稻病害的防治是水稻种植过程中的主要任务,关于水稻病害诊断主要还是依靠农业专家根据病害症状和症状部位进行人工诊断,这种诊断方式固然可靠,
在电子商务和物联网应用快速发展的今天,无线传感器网络(wireless sensor network, WSN)作为物联网的一个重要分支,其应用和性能优化也成为了科学研究的热点。WSN应用对WSN系
在银行等面向事务处理的行业中,计算机系统的可靠性非常重要,系统的延误和失效可能会造成不可估量的损失。因此此类行业一般都采用容错计算机。传统的容错计算机仲裁机制是通
Web服务组合技术能够通过集成一组具有不同功能的Web服务为用户提供新的增值服务。Web服务的松散耦合、动态发现和动态绑定等特性,为生成的组合服务灵活适应其运行时环境的动