基于模糊粗糙集的降维算法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:a41808829739
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,信息技术的广泛应用使企业采集到的数据以前所未有的速度增长.但是海量数据采集后并未得到充分的应用和开发,信息含量高、内容丰富的数据库成为无人问津的数据坟墓,造成资源的极大浪费.知识处理技术的兴起与迅速发展,使海量数据的实际应用成为可能.然而,数据维数过大严重地影响了规则和案例的提取以及基于知识推理系统的响应速度和并发用户数.模糊粗糙集理论是解决数据集维数问题的有效工具,但基于模糊粗糙集的降维算法还不多.本篇论文首先系统地总结了模糊粗糙集的研究成果及发展趋势,根据模糊粗糙近似推演方式的不同,主要形成了三种从不同角度研究的模糊粗糙集.论文对属性模糊化的方法进行了研究,给出了单个属性和复合属性模糊化的一般方法.通过比较国内外在粗糙集和模糊粗糙降维思想与算法,提出了三种模糊粗糙降维算法:属性递减约简算法,基于遗传算法的约简算法以及约简树算法.属性递减约简算法计算复杂性较低,基于遗传算法的约简性能出色,而约简树算法能够找到最小约简,并且不需要对解空间进行完全搜索.铁路货票中包含大量客户及铁路运输相关信息,通过分析研究,结合铁路货运营销专家的经验,综合利用提出的算法对广铁集团的货票数据库进行了降维处理,显著地降低了数据的维数,提取出了影响客户选择铁路运输的因素,从而为广铁集团货运营销分析系统的开发提供了良好基础.
其他文献
网格是属于分布式计算的一种方法,而目前的另一个分布式计算方法是Peer-to-Peer(P2P)技术.P2P与网格技术有许多异同点.总的说来,二者都关注相同的问题,即在虚拟组织中的资源
随着图像压缩技术的发展,使用一般的压缩系统处理后的图像信号带宽大大压缩,可以在一般的通信系统中传输,例如现在的会议电视、可视电话等。但这些压缩系统设备复杂,价格昂贵,仍需
近年来网络通讯技术发展飞快,电子邮件已经成为人们日常工作、生活必不可少的交流工具之一。电子邮件广泛应用给人们带来很大便利,但其中隐藏的经济价值也被利用起来,垃圾邮件由
本文以异构数据源的集成为研究背景,简要介绍了目前异构数据集成所面临的问题及相应的解决方案;提出了基于CORBA技术的异构数据集成系统,详细分析了异构数据集成系统的整体功能
浮体的六自由度运动,是海洋、港口和船舶工程模型试验研究中的的重要参考信息,传统的接触式测量方法是利用直尺测量位移值,使用陀螺仪测量摇角,通过光线示波仪记录信号,人工读取分
基于构件的软件工程从根本上改变了软件开发方式,成为现代软件工程进步中的一个里程碑。它促使了软件大粒度的复用,提高了软件开发速度和质量,降低了开发成本,同时提高了软件的可
地理信息系统(GIS)是用于采集、存储、管理、处理、检索、分析和表达地理空间数据的计算机系统,其研究内容主要集中在空间数据上,属性数据(特别是社会经济属性数据)通常只是
本文针对分布式入侵检测系统进行了较为深入的研究与探索,并在以下方面作出了创新性的贡献.第一,研究了现有的分布式体系结构,指出了现有系统存在的缺点,提出一种基于Agent的
“视频会议系统”是指两个或者两个以上地理上分散的人或者群体,通过传输线路以及多媒体设备,将声音、影像以及文字资料互相传送,达到即时并且互动的沟通,从而完成传统会议目的的
数据挖掘研究如何从大量的数据中智能地、自动地抽取有价值的知识和信息,是当前人工智能中非常活跃的研究领域。粗糙集理论是近年来发展起来的一种有效地处理不精确、不确定的