论文部分内容阅读
概念格是一种有效的知识发现与数据挖掘工具,由形式背景生成概念格的过程,实质上是一种概念聚类过程,反映了概念之间的特化和泛化关系。当形式背景中属性的概念层次发生变化时,如何高效地更新概念格,提高概念格构造效率具有重要意义。本文从提高概念格构造效率出发,当属性的概念层次发生变化,对概念格的高效更新算法进行了研究。主要研究工作如下:(1)给出了一种基于概念提升的概念格更新构造算法UCP。当形式背景中的多个属性进行合并(即概念提升或泛化)时,概念格中的一些概念从低层泛化或提升到一个较高层,利用概念提升前所构造的概念格,只对内涵中含有合并属性的概念进行操作,若该概念的内涵与合并属性的交集为空,则不做任何操作;否则,根据交集的不同生成新增概念或更新概念;然后,合并或删除更新过程中出现的冗余概念,从而得到新的形式背景对应的概念格;最后,以离散化的恒星光谱数据作为形式背景和经典的Godin算法做比较,实验验证了UCP算法的正确性和有效性。(2)给出了一种基于概念特化的概念格更新构造算法UCCS。该算法主要针对形式背景中单属性分解为多属性的问题进行研究,概念格中的一些概念从较高层次特化或例化成较低层次的概念。首先,利用属性分解后的新属性形成的形式背景,构造其相应的概念格;再将此概念格和原概念格的一个子概念格进行比较,得到更新概念、新增概念和特化概念,而不是和原概念格比较进行概念格的更新构造,从而节省了时间,提高了概念格更新构造的效率;最后,以离散化的天体光谱数据作为形式背景,实验验证了UCCS算法的正确性和有效性。(3)基于概念层次的概念格更新构造原型系统设计。在Windows XP操作系统,采用VC++6.0和ORACLE9i开发工具,以离散化的天体光谱数据作为形式背景,设计并实现了基于概念层次的概念格更新构造原型系统。