基于决策值不确定等价类的属性约简算法研究

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:sody520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了广泛存在于现实数据中的属性约简问题。对属性进行约简极大简化了工作量而且得到的结果体现了一类数据的特性,体现了蕴含在数据中的内在关系,使得基于数据的知识发现过程更加简单,因此属性约简问题的研究有着至关重要的意义。在众多求解属性约简问题的方法中,粗糙集理论因其具有仅依赖于原始数据、不需要任何外部信息的特点,在处理这个问题方面具有很强优势,故本文将用粗糙集理论作为求解属性约简问题的工具。本文主要研究内容如下:首先,在求解属性约简问题前,要先解决粗糙集理论不能直接对数据集属性中的连续型数据进行处理的问题。因此,本文提出了一种基于粗糙集相对正域的离散化算法。算法通过计算决策属性相对于条件属性的正域,将论域划分成决策值确定的等价类簇和决策值不确定的等价类簇,在等价类按其条件属性值从小到大排序后,合并相邻的决策值确定的等价类,同时合并相邻的决策值不确定的等价类,并在合并后的所形成的等价类簇中的两两等价类的边界处加入断点,对连续属性进行离散。其次,在得到经过处理的离散数据集之后,本文提出了一种基于决策值不确定等价类的属性约简算法,算法从决策表单个条件属性的决策值不确定等价类出发,利用合并条件属性时决策值不确定等价类数量减少这一结论,使用贪婪算法,按决策值不确定等价类的基数从小到大的顺序选择条件属性进行合并,当合并属性得到的属性子集所形成的不确定等价类的数量为0,合并后的属性子集是独立的且其不可区分关系与原始信息系统的不可区分关系相同时,该属性子集即为信息系统的属性约简。最后,本文算法从粗糙集理论的角度分析和利用了数据间固然存在的内在联系,为连续数据离散化方法和属性约简方法提供了一种新的解决方案。
其他文献
移动渐近线模型法,是一类有竞争力的优化方法,最初用于求解工程上经常出现的结构优化问题,经过一系列的修正改进,在解大规模非线性优化问题时效果较好.共轭梯度法十分简便,是常用
本文以一种典型的形式化方法——逻辑化方法为研究方向,研究如何应用计算机程序证明数学定理。具体地说,如何通过一套逻辑符号体系将人脑的推理证明过程形式化,从而转化为一系列
我们关注的是Broadwell模型系统的Cauchy问题的解在大时间范围内的渐近行为。当系统对应的守恒律的相应Riemann问题存在由接触间断和激波组成的解时,证明对于Broadwell模型系
众所周知,构成人类神经系统最基础的部分是神经元,又称其为神经细胞。随着神经网络系统研究的逐步深入与大力发展,其功能越来越强大,可处理的问题也越来越多。对于人类神经系
公馆春秋  建筑,是文化的物质传承。了解一座城市的来龙去脉,就得读懂这些城市的“年轮”。那些不是经历过家庭兴衰岁月,就是经历过战争时期的硝烟而幸存下来的公馆建筑,就正如城市“年轮”,一砖一瓦承载的是这座城市的质感与文化品格。  要说重庆的公馆建筑,在陪都时期数量最多,且最具代表性。当时正处于对外来文化的空前接收期,大多公馆建筑是由从欧洲游学归来的中国建筑师设计。那个时代的建筑就不仅继承了欧洲的建筑
设Ci()Rm,i=1,2,…,t,Qj()Rn,j=1,2,…,r..Rm,Rn分别是m维和n维Hilbert空间上的的非空闭凸子集.由Censor提出的多重集合分裂可行性问题(MSSFP),是指找到一个向量x∈∩ti=1Ci使得Ax∈∩rj