论文部分内容阅读
概念格理论又称为形式概念分析,用于概念的发现、排序和显示。它作为一种用于数据组织和数据分析的形式化工具,在理论研究和实际应用上都具有重要意义,已经在多个领域获得了成功的应用。概念格作为形式概念分析中核心的数据结构,本质上描述了对象和特征之间的联系,表明了概念之间的泛化和特化关系,其Hasse图则实现了对数据的可视化。而Hasse图中概念结点的布局算法对概念格的可读性、图显示的时间效率有着不可忽略的影响。本文在研究了概念格Hasse图的经典布局算法后,重点分析了使用回溯查找法的附加线图布局算法,指出其中效率低下的原因,提出了直接赋值附加线图布局算法DAAL。直接赋值附加线图法摒弃了传统的回溯查找法,采用直接赋值,间接使用概念矢量和的方法,有效地减少了给属性集寻求矢量集的过程,提高了概念格布局的效率;而其中使用的相关概念相邻的思想也使概念格的可读性得到提高。本文同时提出了一种新的概念格布局优化策略:基于线性交换的概念格Hasse图二次布局。在移动概念结点位置时,只有相邻两层的边交换情况会受到直接影响,算法根据这一点对分层结构的概念格进行隔层取概念,获得一层的概念后,线性交换概念结点位置,并计算交换前后相邻两层边的交叉数,根据边交叉数的变化来决定结点的位置。该二次布局算法使得概念格Hasse图能够处于边交叉数较少的状态下,使其可读性得到了较大提升。通过在相同数据下进行的布局算法与优化策略的实验,可以证明本文所提出的直接赋值附加线图布局算法相比于传统的附加线图布局算法在时间与“美观”性方面都有很大改进;基于线性交换的Hasse图二次布局算法对于图的可读性起到了积极的作用。本文的主要工作包括以下四个方面:1.提出了直接赋值附加线图概念格布局算法。2.提出了一种基于线性对换的概念格二次布局算法。3.通过实验对概念格布局算法进行了分析与比较,验证了本文所提出算法的有效性。