论文部分内容阅读
网络技术大大提高了人的生存质量和人的素质,使人成为社会人、全球人,同时,网络的普及也给人们带来了海量信息,大量信息在给人们带来方便的同时也带来了一大堆问题:第一是信息过量,难以消化;第二是信息真假难以辨识;第三是信息安全难以保证;第四是信息形式不一致,难以统一处理。于是人们开始考虑:“如何才能不被信息淹没,而是从中及时发现有用的知识、提高信息利用率?”面对这一挑战,数据挖掘和知识发现技术应运而生,并显示出强大的生命力。由于形式概念分析中的概念格具有良好的数学性质、适合批处理和能表示概念之间的关系等特点,我们认为概念格模型可以用来作为数据挖掘的一种非常理想的工具。形式概念分析是从形式背景这一基本的数据形式开始的,因此形式背景的规模是影响概念格构造和应用的一个重要因素。为此,本文对形式背景进行了较为全面、系统的研究,提出了形式背景核的概念和相关的限定性定理。利用形式背景核的有限元素等价地表示一类无限的形式背景,从而达到用核中元素的格快速生成新的概念格的目的。主要的研究内容涉及形式背景的提取、切分、约简和同构判定,以及形式背景核的代数性质和形式背景核的构造算法等。依据降低形式背景数据量的思想,给出了形式背景切分和约简的具体算法,并按照对形式背景基的定义,实现了形式背景基的算法,给出了形式背景基性质的证明,通过对形式背景核基本算法的研究,给出了形式背景核的改进算法,从而降低了求n阶形式背景核的时间复杂度和空间复杂度,提出了n阶形式背景核的限定性定理,并给出了证明。本文的目的也就是通过分析概念格的数学模型、性质,对形式背景进行系统的分析探讨,为概念格的同构构造提供理论基础,从而进一步将概念格应用于数据挖掘。本文的主要贡献如下:(1)提出了n阶形式背景核的概念,对n阶形式背景核的构造算法进行了研究和改进,解决了n阶形式背景核构造的基本算法的效率低的问题,给出了两种算法的时间复杂度的对比;同时说明了形式背景核的理论意义及应用价值。(2)提出了形式背景核的限定性定理,通过另一个重要概念——形式背景