【摘 要】
:
经典粗糙集理论是一种处理完备数据的数学工具。由于数据的测量误差、对数据提取的限制等原因,导致不完备、不确定的数据随处可见,并且数据随时间动态变化,这使得经典粗糙集理论应用受限。因此如何高效的处理动态变化的数据,找到合适的粗糙集扩展模型是当前研究者们重点研究的课题之一。在粗糙集理论中,特征选择是知识获取的关键和核心。利用传统的属性约简算法对动态数据进行属性约简,需要消耗大量的计算时间,占用较大的内存
论文部分内容阅读
经典粗糙集理论是一种处理完备数据的数学工具。由于数据的测量误差、对数据提取的限制等原因,导致不完备、不确定的数据随处可见,并且数据随时间动态变化,这使得经典粗糙集理论应用受限。因此如何高效的处理动态变化的数据,找到合适的粗糙集扩展模型是当前研究者们重点研究的课题之一。在粗糙集理论中,特征选择是知识获取的关键和核心。利用传统的属性约简算法对动态数据进行属性约简,需要消耗大量的计算时间,占用较大的内存,最终导致运行速度缓慢,无法达到预期的效果。因此在不完备信息系统中如何动态更新属性约简算法,提高算法的效率是数据挖掘等领域的重点课题之一。本文以粗糙集为基础,以获取知识为目的,针对动态变化的不完备信息系统的属性约简方法进行深入的研究和讨论,主要工作包括:首先,以限制容差关系模型为基础,考虑了由于属性值缺失程度的不同而导致的不完备信息系统的差异性,结合完备度的定义,给出了对象间完备度的限制容差关系的粗糙集扩展模型,并对该模型进行理论和实例的证明。其次,结合正区域的定义提出了一种新的正区域的等价计算公式。当属性集发生动态变化时,分析了正区域的计算方法,结合属性重要度的定义,设计了属性集增加和删除时的更新算法(算法AIAR和算法DIAR),并对算法的时间复杂度进行分析,证明了算法的可行性。另外,讨论了当单个对象发生动态变化时新正区域的计算方法,根据正区域的计算方法和已有算法,给出了单个对象动态变化时的更新算法(算法ASOIAR)。当多个对象发生动态变化时,根据算法ASOIAR的思想,提出了多个对象动态变化时的更新算法(算法MOIAR),并通过时间复杂度分析验证了算法的有效性。最后,从UCI数据库中选取4个不完备数据集,分析并验证了算法的有效性和合理性。
其他文献
目的:明确 miR-205 对内皮祖细胞(endothelial progenitor cells,EPCs)增殖、凋亡、迁移和成血管能力等生物学功能的影响;明确miR-205对EPCs向深静脉血栓部位归巢能力的影响及其治疗效果;探讨miR-205调控EPCs血管新生的靶点及调控机制。方法:1.利用慢病毒感染EPCs,分为四组:即空白对照组(未经处理的EPCs),NC组(慢病毒空载LV3-NC质粒
现代战争中,随着军事需求偏向于远增程、高精度的作战指标,并考虑到火箭弹低成本和高费效比等优点,通过提高火箭弹在滑翔增程阶段的增程效率以及末制导阶段的协同制导效能可
在光学系统中,若只是采用球面光学元件,该元件只能提供球面曲率半径作为可优化项。与非球面相比离轴非球面还有离轴量以及口径限制,有着更加灵活的设计自由度,若应用与光学系
果桑资源的开发利用已成为蚕桑产业发展的新型经济增长点,然而桑椹菌核病(Mulberry fruit sclerotiniosis)是制约果桑产业健康发展的重要因素之一。桑椹菌核病主要有肥大性、
丝素蛋白具有优异独特的力学性质,光学性质,生物相容性和可控的降解性。近年来,有着精细结构的丝素蛋白被证明在生物工程和医疗等方向上有许多潜在的应用价值。但在常见的微
粗糙集理论作为一种能够有效地分析和处理不精确、不完备、不一致信息的数学工具,近几年已被广泛应用于各个领域.若粗糙集的上、下近似与目标集合的相似度不是很大时,会导致规则提取精度不高、不确定性较大.针对此问题,本文在不完备信息系统中研究了求最优近似和约简的算法,内容如下:在不完备信息系统中,针对近似问题,给出了最优近似的启发式算法.最优近似是与目标集合相似度最大的可定义集,且它位于上、下近似之间.因此
散堆料场颗粒扬尘造成细微颗粒物的扩散,是城市颗粒污染的主要来源之一。本文采用数值模拟与PIV(Particle Image Velocimetry)实验相结合的方法研究了不同粗糙元排列形式对料
随着工业经济向服务经济的城市转型,服务业已成为拉动现代城市经济和就业增长的主导产业部门。生产性服务业技术创新性强、关联产业多,它既对城市经济产生巨大的直接影响、更为城市建设和其它众多产业部门的发展提供了支撑,因而成为大城市中最具活力、发展最快的服务业部门。与此同时,作为一种速度快、运量大、票价低的公益性基础设施,轨道交通既直接提升了城市出行的可达性和普惠度,亦使更大范围内城市经济活动的参与主体被便
认知无线电网络中的信道交汇技术和信道接入机制能够允许多个未授权用户同时跳转至未被使用的授权频谱,并使得某个未授权用户赢得接入该频谱进行数据通信的机会,进而有效提高