空间数据挖掘中的聚类算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jackchenz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间数据挖掘是指从包含空间信息的数据库中抽取隐含的知识、空间关系或有意义的特征模式。它在理解空间数据、获取空间与非空间数据的内在关系上具有重要意义。空间聚类分析是空间数据挖掘中一个重要的研究方向,它是按照某种相似性度量值,对空间数据集中的数据对象进行归类和标识成簇,使得同簇中的对象尽可能相似,而不同簇间的对象彼此不相似。空间聚类分析既可作为独立的空间数据挖掘工具,又可作为其它方法的预处理方法,目前已经应用在地理信息系统、遥感、医学图像处理、环境研究等领域,具有重要的实用价值。 在空间聚类算法研究方面,目前已经有很多比较成熟的聚类算法,如CLARANS算法、BIRCH算法、DBSCAN算法、CLIQUE算法等。虽然其中很多算法得到成功应用,但是在某些方面仍然存在一定局限。如DBSCAN算法将密度概念引入聚类,能生成任意形状的聚类,但该算法在海量数据的处理、高维数据的聚类方面具有明显不足。而CLIQUE算法采用网格和密度的思想,解决了高维数据的聚类问题,但面临障碍约束、复杂形状等情况下的聚类存在许多问题需要解决。本文主要围绕障碍约束问题和提高算法效率方面对空间聚类算法进行研究。 本文针对空间障碍约束下的聚类问题,提出了基于CLIQUE算法的空间障碍约束聚类算法,有效的解决了二维空间障碍约束下的聚类问题。该算法通过引入障碍网格的概念和障碍物的网格化表达,使其能够处理任意形状的障碍约束聚类。在此基础上针对任意形状的实体目标对该算法进行扩展,解决了任意形状的聚类问题。此外由于基于网格的聚类算法对高维空间具有良好的拓展性,因此该算法很容易拓展到高维空间的情况。实验证明新算法针对障碍约束下及任意形状的聚类问题均能取得较好的效果。 本文还针对DBSCAN算法I/O开销和内存消耗大的缺陷,提出了基于层次合并的密度算法。该算法主要思想是:选择数据库中无任何标识的点进行核心点判断,围绕核心点生成源簇,再对含有公共点
其他文献
随着Internet/Intranet的快速发展,部门之间需要协同合作,如何共享这些异构数据源的数据成为很至关重要的问题。同时异构数据库的存在给实现不同信息系统间数据的访问操作带
现代故障诊断系统是一个动态的、分布的、柔性的和不确定的复杂系统。多Agent能够利用并行分布式处理技术和模块化设计思想,把复杂系统划分成相对独立的Agent子系统,通过Agen
随着软件产业的发展,遗产软件日益增多,软件再工程已经成为一个重要的研究领域。系统理解是软件再工程的基础,可以弄清一个程序“做什么”以及“如何做”,目前存在着许多正在使用
近年来信息技术迅猛发展,很多的信息管理领域得到发展并不断壮大。电子商务、电子政务、办公自动化和企业信息系统的应用成为了当今管理信息系统应用的热点。在这些领域中,业
随着Web技术的发展,Internet已经发展成为一个巨大的全球化信息空间。在这种情况下,用户面对浩瀚的信息海洋,往往无法准确找到自己所需要的信息。传统搜索引擎的出现在一定程度
KDD是在数据库和人工智能的相互融合渗透中逐渐发展起来的一个有着广阔应用前景的新兴研究领域,是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式
信息化热潮已经到来,数据库的应用相当普及,然而信息安全形势不容乐观,许多大中型数据库仍存在众多隐患,安全性问题不容忽视。数据安全,不只是数据库本身的问题,而是一个整体
装配序列规划(Assembly Sequence Planning, ASP)就是在给定产品模型下,找出满足几何、机械、工艺等装配约束要求的合理的零件装配顺序。基于事例推理(Case-Based Reasoning,
本课题来源于智能水下机器人技术中“水下光视觉信息处理和理解技术”项目。自动目标识别系统对于提高水下机器人的自主能力,顺利完成目标探测和定位的任务具有很重要意义。
随着国家对煤矿安全问题重视度的提高,越来越多的人参与到了井下人员跟踪定位管理系统的研究,研制了许多使用于矿井中的人员定位系统,但是这些技术对人员只是一个粗略地定位,