基于邻域多粒度粗糙集的混合数据知识获取方法研究

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:yilishabai123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论作为一种有效的数据挖掘分析工具,已广泛应用于知识发现、机器学习和图像处理等领域。属性约简与规则获取是粗糙集理论的核心研究内容之一,在过去的30多年里,取得了丰富的研究成果。然而,随着通信、传感、人工智能等信息技术地飞速发展,很多行业中的数据日益呈现出混合属性的特征,且累积的数据量在以惊人的速度不断增长。虽然大数据中所蕴含的不可估测的价值已经成为学术与产业界的共识,备受许多国家的关注,但是,只有从数据中挖掘出有意义的知识才能真正发挥海量数据的潜在价值。如何从多粒度、多层次的角度对这些海量的混合型数据进行有效处理,成为当前数据挖掘领域中具有挑战性的研究课题。本文主要研究基于邻域多粒度粗糙集的混合数据知识获取方法,内容包括:基于双重粒化准则的邻域多粒度粗糙集快速约简算法为了有效降低属性约简计算过程中的迭代次数,实现邻域多粒度粗糙集模型下的快速属性约简算法,论文基于双重粒化准则,深入分析不同属性子集序列和邻域半径对正域的影响,结合正域在属性子集和邻域半径共同作用下的单调性,提出一种基于双重粒化准则的邻域多粒度粗糙集快速约简算法,并通过理论分析与实例对比验证了算法的有效性和优越性。基于MapReduce模型的邻域多粒度粗糙集模型并行约简算法为了能够有效处理数据类型多样的分布式海量数据,并降低属性约简算法的时间复杂度,以邻域多粒度粗糙集模型为理论基础,从hash散列、正域计算、边界样本删减三个方面提取并行点,设计了一种基于MapReduce模型的邻域多粒度粗糙集模型并行约简算法。多种数据集下的实验对比分析验证了所设计算法的有效性。基于最大粒的悲观邻域多粒度粗糙集规则获取算法为了从多粒度、多层次的角度处理数值型或混合型数据,基于邻域多粒度粗糙集模型,通过计算邻域多粒度条件粒与决策粒,分析条件粒在规则获取过程中的冗余关系,进而枝剪规则获取过程中的冗余条件粒,在此基础上,设计了一种较为高效的基于最大粒的悲观邻域多粒度粗糙集规则获取算法。为弥补给定邻域半径在实际应用中的缺陷,在邻域多粒度粗糙集模型的基础上进一步引入自适应半径,计算基于双重准则邻域多粒度粗糙集模型的最大粒,提出了基于最大粒的双重准则悲观邻域多粒度粗糙集规则获取算法,并进行了实验对比分析。
其他文献
中西部高校联盟能够极大地促进教育公平,明确中西部高校联盟的发展概况,通过联盟高校开展的两次经验交流会,中西部联盟高校拟在教师互聘、学科共建、科学研究、资源共享等方
在新医改下,公共卫生服务事业有了显著成效,但仍存在发展不足、发展水平不高等问题,本文通过分析南充市顺庆区基本公共卫生服务均等化的现状,发现存在投入不足、资源配置不均
对未来我国海工起重设备行业的市场容量进行了预测,指出了我国海工起重设备面临的发展机遇.并对行业内企业的竞争状况进行了分析。
介绍了工业设计专业教学实验的体系和结构,说明了工业设计专业实验教学的必要性和可行性,并且提出了工业设计实验体系的构建方案。
目的研究防己黄芪汤对内毒素脂多糖(LPS)与二甲基亚硝胺(DMN)联合造模的肝纤维化小鼠肝线粒体过氧化损伤的影响。方法以ELISA法检测用药后肝纤维化小鼠肝线粒体三磷酸腺苷酶(
<正> 田径全能运动是由跑、跳、投部分项目组成的综合性项目,对运动员身体素质要求很高,它必须使速度、力量、耐力、灵巧性、柔韧性等素质得到全面的发展。同时,由于项目众多
本文试图通过把握苏力先生在本土资源论中的理论基础和逻辑思路 ,从知识论、核心概念、理论前提和逻辑论证等四个方面指出苏力的论证过程存在的问题。本文作者认为 :法律制度
池塘是一个复杂的生态系统,溶解氧是描述该系统的重要参数之一。池塘溶解氧呈24小时周期连续变化,因而可用时间序列分析的方法来建立池塘溶解氧的ARMA(p,q)模型。通过一个实
<正>能源企业强化内部控制的必要性伴随着国际能源产业的竞争日益激烈和残酷,国内能源企业的管理工作面临着前所未有的挑战。内部控制管理是能源企业管理工作的关键环节,是能
众所周知,心脏病已经成为威胁人类康健和性命的头号杀手。心脏病具备死亡率高的特征,并且突发性高、难以预测,所以能够进行实时的心电信号监测显得尤为重要。当前,随着人们生