论文部分内容阅读
迅猛发展的信息技术,特别是现代网络、云计算等技术的广泛应用,数据量呈爆炸式增长态势,同时进入系统的信息来源越来越广,相关层次越来越复杂.具备多源多模态等特征的复杂大数据已经成为现代社会中数据资源和知识发现的主体.人们迫切需要去分析处理这些复杂数据,从中找到有价值的信息.然而面对这些复杂数据,传统的数据处理技术遇到了极大挑战.因此,如何有效、快速地的处理这些复杂数据,并提取出隐含其中的、潜在有用的知识,一直是智能信息处理领域的一个研究重点.作为知识获取和问题求解的重要工具,粒计算方法是在问题求解过程中通过将复杂数据进行信息粒化用信息粒代替样本作为计算的基本单元,从多个角度、多个层次出发对现实问题进行描述、推理与求解,可大大提高计算效率并获得问题更加合理、更加满意的求解.本文将人类解决问题的多粒度思想引入到粗糙数据分析中,系统的开展了基于多粒度粗糙计算的方法研究.这极大地丰富了粗糙数据建模理论研究与应用范畴,有望为多源信息系统下的多粒度信息融合提供一个新途径.获得主要研究成果和创新如下:(1)发展了多源符号型数据和多源模糊型数据信息粒度的结构表示与融合模型.为了拓展多粒度粗糙集的建模能力和应用范围,分别建立了多粒度覆盖粗糙集模型和模糊多粒度决策粗糙集模型,深入探讨了模型的性质,并揭示了这些模型之间的本质差异,为多源粗糙数据分析中的模型选择提供了理论基础和可行的依据.(2)从拓扑学理论的角度探讨了多粒度粗糙集模型的相关理论.定义了多粒度拓扑粗糙空间并讨论了该拓扑空间的重要性质,揭示了多粒度拓扑空间的内部结构,通过定义粒度的重要性度量,并根据保持目标概念的内部和闭包不变原则,提出了一个粒度空间的选择算法,从而进一步完善了多粒度粗糙计算理论.(3)从不同的角度提出了多粒度近似空间的不确定性度量.借鉴广义知识距离的思想,构造了多粒度近似空间的融合信息熵,融合粗糙熵和融合知识粒度,给出了多粒度拓扑粗糙空间的拓扑粒度和拓扑熵;提出了多粒度覆盖粗糙集的粗糙度和粗糙熵,并讨论这些度量的有关重要性质.这些结果将有助于理解多粒度粗糙计算理论作为不确定性问题求解理论的本质.(4)结合证据理论,提出了一类基于证据理论的多粒度融合算法.讨论了乐观/悲观多粒度粗糙近似和经典/模糊证据理论的信任函数之间的关系,给出了多粒度粗糙近似空间证据的基本概率指派获取等问题.借鉴K-Modes聚类的思想完成多个粒结构的聚类,提出了一类基于证据理论的多粒度融合算法.在一定程度上解决了多源不确定信息的定量和定性融合问题,也增强了处理多源信息系统不确定问题求解的能力.(5)提出了三类整体决策性能评价指标.通过分析近似精度和近似质量在度量决策性能的不足基础上,利用最大最小合成方式提出了整体确定度,整体协调性,整体支持度.理论分析和实例验证结果表明,提出的决策规则集的评价方法对未来的预测更合理可靠.通过以上系统研究,本文在多粒度粗糙计算理论与方法研究方面取得了系统的研究结果,发展了多粒度覆盖信息粒度的结构表示和定性的融合方法;从多粒度拓扑理论和多粒度近似空间的不确定性这两个侧面完善了多粒度粗糙计算基本理论;建立了多粒度定性融合算子和定量的证据理论的信任函数之间的关系,发展了一类基于证据理论的多粒度融合算法,提出了整体融合决策性能评价方法,这些成果丰富和发展了多粒度粗糙计算理论和方法,为多粒度粒计算方法能够更好的处理多源复杂数据提供了理论指导和技术支持.