【摘 要】
:
聚类分析作为数据挖掘的一个重要任务,具有广泛的应用领域,这些不同的应用都对聚类分析算法提出了新的要求。本文提出了基于网格的并行聚类分析算法PGMCLU,该算法的创新点主
论文部分内容阅读
聚类分析作为数据挖掘的一个重要任务,具有广泛的应用领域,这些不同的应用都对聚类分析算法提出了新的要求。本文提出了基于网格的并行聚类分析算法PGMCLU,该算法的创新点主要包括:定义了网格紧凑度、网格密度连通、网格特征值、簇密度以及簇相似度的概念;提出了基于网格单元划分的数据分区方法,基于网格密度连通概念的局部聚类方法,以及基于簇相似度度量的局部聚类合并方法;实现了对网格密度阈值参数minPts的自适应设置。该算法可以较好地处理高维和海量数据集,并具有识别不同形状和密度簇的能力。数据流是指潜在无限的、持续而快速到达的具有时间顺序的数据对象的集合。数据流的实时性和潜在无限性,决定了数据流聚类分析算法与传统的基于静态数据的聚类分析算法相比,具有一些新的特性。本文提出了基于网格的数据流聚类分析算法GC-Stream,该算法的创新点主要包括:提出了描述网格单元概要信息的特征向量结构;对SP-Tree做了改进,提出了基于List结构的LSP-Tree空间索引结构;提出了对网格单元信息的指数衰减策略,以及对噪声网格单元和过时网格单元的剪枝策略。该算法较好地满足了数据流聚类分析的实时性要求,并对内存空间具有动态的适应性。详细而全面的实验证明了PGMCLU和GC-Stream算法的正确性和有效性,因此,这些研究成果具有重要的理论价值和实际意义。
其他文献
随着我国航天事业的发展,在轨运行的卫星越来越多。研究人员往往需要查看卫星在某一时刻的瞬时视场,这就需要对卫星瞬时视场进行建模计算。伴随着在轨运行卫星数量的增加,研究人员掌握的遥感数据越来越多。海量的遥感数据往往掌握在不同的单位,这就面临数据共享的问题。随着数字地球的出现,三维GIS发展迅速。基于数字地球的影像数据可视化成为需要解决的问题。本文针对上述问题进行研究,首先针对卫星瞬时视场问题进行研究,
遥感技术是现代化高科技之一,它极大地拓展了人们的观测视野,丰富了对地观测信息的来源。近年来随着遥感技术的不断发展,尤其是高光谱遥感的出现,给遥感界带来了一场重大的革命,极大地扩展了遥感的应用领域。因此对高光谱遥感技术的研究有着广泛的理论意义和应用价值,一直是遥感领域的研究热点和焦点。高光谱遥感数据的分类是遥感数据分析和信息提取的重要方法。针对支持向量机适用高维特征、小样本的优越性,是一种极具潜力的
随着4G时代的到来,推荐系统作为大数据时代的产物在电子商务、信息检索以及移动应用、社交网络等众多领域都取得了不错的发展。伴随着这些应用的发展用户和产品数目不断增长,
随着汽车工业的飞速发展,汽车电控单元(electronic control unit,ECU)的数量越来越多。大量ECU的使用对汽车控制程序也提出了更高的要求。汽车电子控制从硬件到软件都变得更复
近年来,随着信号处理理论和计算机的发展,人们开始用摄像机获得周围环境图像并将其转换成数字信号,用计算机实现对视觉信息的处理,这就形成了计算机视觉这门学科。成像在视网膜上
随着汽车工业的不断发展,车辆从人们生产生活的一种机械化工具,逐步发展成为智能化,集成化的多信息交互平台。人们要求车辆除满足基本要求以外,更希望他能够像一位助手,在各种不同的应用环境中协助处理更多,更复杂的事情。随着汽车电子技术的不断发展,以及计算机嵌入式技术的引入,基于单片机嵌入式技术的车辆电控系统控制器已经逐渐成为大型车辆和高档轿车的控制核心。车辆电控系统控制器主要用于对现代车辆中各类设备运行参
随着计算机操作系统的发展,其架构逐渐呈现出多样化。一体化内核由于其在性能等方面的优势,一直是操作系统的主要架构。但随着人们对系统安全性和灵活性的日益关注,其它架构
软件复用是在软件开发中避免重复劳动的解决方案,有效的软件复用是提高软件生产效率和质量的切实可行的途径之一。而构件库作为软件复用的基础设施,在构建复用的软件开发过程
图像配准是对两幅或多幅来自不同设备或不同时间拍摄的图像进行空间位置对齐的过程,目标是为了寻找它们之间的一个空间变换,使得在这个最优变换基础上,两幅图像间的像素点在
无线传感器网络是由大量的体积小、价格低廉、电源能量极其有限、存储能力和数据处理能力比较弱、具有无线通信和监测能力的微型节点通过自组织的方式形成的网络。这些节点被