论文部分内容阅读
近年来,随着云计算、物联网、社交网络、人工智能等新型信息技术的迅速发展,数据爆炸式增长并快速改变人们的生活方式。面对数据量的极速增长,如何从海量数据中快速高效的获取需求的知识已成为研究的热点。粒计算作为一种在不同知识粒度空间上求解复杂问题的新工具,已广泛应用于数据挖掘、模糊信息处理、大规模计算、云计算等方面。粒计算理论主要包括粗糙集理论模型、模糊集理论模型和商空间理论模型等。其中,不同理论模型之间的关联研究既为复杂知识问题的求解提供了解决思路,还为不确定性知识获取的研究完善了理论依据。本文基于多粒度计算的思想,主要开展了以下几个方面的研究工作:(1)对于一个不确定性概念,可以通过改变信息粒度的方式获得不同的知识近似空间。首先针对信息粒度表示问题,给出由一般二元关系导出的知识粒度概念。讨论了不确定性概念在分层递阶商空间结构下的粒度序列与近似精度序列的变化规律。然后为了能够根据用户需求自动搜索最优知识空间,构建了基于知识粒度和近似精度的粒度效用函数并给出了一种求最优阈值的算法。(2)定义并讨论了两个分层递阶商空间结构之间的分类同构和粒度同构等问题。通过分析由模糊等价关系构建的分层递阶商空间结构,发现了模糊等价关系在分类方面的特质。随后提出了一种基于给定的分层递阶商空间结构来生成同构模糊等价关系算法,进一步揭示了同构的模糊等价关系的分类本质。(3)从多粒度的角度,首先研究了粗糙集近似集模型中的知识度量方法,考虑空间粒度的变化情况,给出了粗糙集近似集的模糊度概念。其次分析了多粒度空间下粗糙集近似集的模糊度随知识阈值的变化规律。证明了该模糊度随着知识阈值的不断递增会呈现单调递减的变化规律,为利用该模糊度设计启发式的知识约简算法奠定了基础。最后提出了一种相应的属性约简算法,通过实验表明本文提出的模糊度在知识获取方面具有较好的特性。