基于粒度计算和遗传算法的数据挖掘算法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:ZHIWEINIU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的成熟和知识发现等领域技术的不断发展,数据挖掘技术应运而生,并在越来越广阔的领域得到应用和发展。粗糙集方法是一种重要的数据挖掘方法,是由波兰科学家Z.Pawlak教授于1982年提出的一种处理不精确、不一致、不完整等各种不确定信息的强有力的数学工具。其主要思想是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则,而且在没有提供任何先验信息的前提下,其也能有效地处理和分析各种不确定数据信息,并从中发现隐含的知识,揭示潜在的规律。近年来,粗糙集理论已经在数据挖掘、决策分析、人工智能、模式识别等诸多领域都得到了成功的应用。进一步探索更加高效的分类和属性约简算法是目前国内外研究的热点。   本文将数据挖掘理论、粒度计算理论以及遗传算法理论三者有效结合,对于如何改进决策树分类算法和属性约简算法进行了深入地研究,主要工作包括以下几个方面:   (1)对数据挖掘(Data Mining)技术进行了总体上的概述,包括数据挖掘的定义、研究的现状以及当前存在的问题、一般过程、主要研究方法和技术,为在这一领域进行更深入的研究打下了良好的基础。在此基础上对现有决策树分类算法和属性约简算法进行了综述,并对各种现有算法进行了比较和分析。   (2)提出一种基于属性支持度的决策树算法(DTBAS算法),该算法首先在粒度计算理论基础上提出了属性支持度的概念,然后将其作为决策树构造中选取测试属性的标准。实验结果表明DTBAS算法较ID3算法、C4.5算法分类精度更高、计算量更小。   (3)提出一种基于改进的自适应遗传算法的属性约简算法(MGAAR算法),该算法主要做了三点改进,引入了属性核以对随机产生的二进制初始种群加以限制,在适应度函数中引入了条件属性对决策属性的支持度,并对交叉概率和变异概率进行了新的设定。通过实验分析表明该算法大大减少了迭代次数。
其他文献
近年来,随着视频数据的增加,基于语义的视频检索成为一个研究热点。在推动高效的视频检索和视频挖掘的过程中,自动的语义概念检测扮演重要的角色,因为它是跨越低层特征和高层
随着Web服务技术的快速发展与成熟,Web服务的应用越来越广泛,Internent上的Web服务数量越来越多。如何从众多的Web服务中快速的发现并选择出既满足服务消费者的功能性需求,又
随着高职院校教学管理现代化进程的加快和教学体制的改革,各大院校的教务管理正向“规范化、信息化、网络化”的方向发展,而基于学分制的选课方式也被运用到教学管理中。基于
为保护数字作品版权人的利益,数字版权管理DRM技术得到人们的广泛认同。然而DRM技术重在保证获得权限的用户可以访问数字内容,却在支持权限的合理转移方面略显不足。对应传统的
20世纪以来,不确定性的科学价值和现实意义逐渐被人们所接受。学者们通过对概率论、模糊集理论以及近年来发展起来的粗糙集理论的应用,使得不确定性问题的研究取得了很大进展,其
认知图是一种软计算工具,是近年来兴起的一种新的知识管理方法和知识表达工具,它可以用来表示相关领域中实体之间的因果关系。认知图推理就是在认知图的基础上,利用已知的知
图像中包括哪些类别的对象?对象的具体位置在哪里?每一类的对象有几个?对象有什么姿势动作?它们之间的关系又是怎样?如果让人们回答这些问题,是一件很容易的事情。但普遍意义
当今信息存储对于各行业的重要性日益明显,对存储软硬件的容量增长、可靠性和高效性等都提出了新的要求和挑战。在信息存储领域,磁盘阵列技术从产生起就一直发挥着重要的作用
中文信息处理技术在当代有广泛的应用。随着互联网和计算机应用技术的快速发展,大量数据向中文信息检索、处理提出新的课题和需求。本文在计算语言学及形式语义学的基础上:(1
计算机断层成像技术(Computed Tomography, CT)是与MRI、同位素扫描、超声图像等一样重要的医学图像诊断手段。与其他医学成像方法相比,CT成像具有检查方便、无痛苦无创伤、