论文部分内容阅读
随着信息技术的发展,数据库的应用范围不断扩大,搜索信息量不断增加。从已存在的大规模的、带有噪声的数据中提取出隐含其中,人们感兴趣的有用信息和知识,已成为信息技术产业界急需解决的一个问题。于是数据挖掘便诞生了。数据挖掘是知识发现的一个步骤,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出有效的、新颖的、人们事先不知道的,但潜在有用的信息和知识的过程。数据挖掘中主要的几种方法是:定性概念描述、分类规则、关联规则、聚类分析、偏差分析知识等。Morse理论最初是由Marton Morse提出的,通过分析黎曼流形上Morse函数的临界点来研究流形的拓扑结构,是一种非常有用的优化工具。它是微分拓扑学的一个重要分支。随后,在Morse理论的基础上Forman进行了进一步的研究,将离散结构引入Morse理论中,最终形成了离散Morse方法。由于离散Morse方法不受空间连续性的限制,所以它有了更为广泛的应用,成为了一种更强加有力的优化工具。目前离散Morse方法主要应用在计算机图像学、图形的可视化、海洋特征结构的提取等一些拓扑图形方面。本文主要介绍了数据挖掘中的分类规则和聚类分析两种技术,并结合了离散Morse方法,得到新的数据挖掘算法。第一,利用数据挖掘中的相关知识将层次聚类方法应用到分类规则中。首先利用层次聚类方法对数据库中的已知数据对象进行聚类分析,目的是将大量的具有相同属性的数据对象聚合到一个簇中。然后对每个簇中的数据对象进行分类分析。第二,将离散Morse方法应用于分类规则中,提出了一种新的分类规则方法---基于离散Morse方法的分类规则挖掘算法。该算法将事物数据库中出现的每个项看作一个顶点并连接顶点形成单纯复形,然后在单纯复形上构造离散梯度向量域和离散Morse函数,从而得到分类规则,并通过仿真实验对该算法进行了分析验证。第三,将离散Morse方法应用于层次聚类方法中,提出一种基于离散Morse方法的层次聚类新方法。首先它是利用层次聚类中的变色龙算法得到划分图(即初始的聚类图),然后在划分图上利用离散Morse方法的相关知识来构建单纯复形,然后对单纯复形上的边和点进行分析得到聚类结果。