高维数据子空间聚类研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:kaixin314159
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大规模数据收集技术、存储技术、网络技术以及信息技术的发展,越来越多的企业、组织和个人正逐步陷入数据泛滥但知识匮乏的困境中,聚类分析已经成为从大量冗余数据中提取有用信息的主要手段之一。目前,针对低维单类型数据的聚类算法研究已经相当成熟,但是,受“维度灾”的影响,许多针对低维数据的聚类算法往往不能应用于高维数据,尤其是对于混合型数据尤其明显。然而,在信息爆炸的今天,现实生活中高维数据又普遍存在,而且呈现逐步增多的趋势,比如:基因数据、网页数据、文本数据、多媒体数据、金融数据等,因此找到一种相对通用的聚类算法用于高维数据的聚类工作有着非常重要的现实意义,尤其是对高维分类型数据和高维混合型数据。  针对这些问题,提出了一种子空间聚类算法,该算法综合考虑特征子空间和噪声子空间的信息,从而得到一个有效的子空间的自动搜索方式;进而又提出了一种的能应用于混合型数据的相似度的度量方式,设计出了一种具有较好通用型的聚类算法,对高维数据进行聚类,该算法能同时应用于分类型数据、数值型数据、混合型数据聚类,具有一定的理论价值和现实指导意义。
其他文献
随着传感器技术、微型机电系统(MEMS, Micro-Electro-Mechanic System)以及无线通信技术的飞速发展,无线传感器网络(WSN,Wireless Sensor Networks)技术日趋成熟,这项技术已
用户统一身份认证系统要研究开发一套企业级的用户身份认证平台,提供一个完整的用户身份认证体系。基于目录服务的统一身份认证系统,采用了LDAP 标准协议,利用了目录服务的分
随着MDA技术的流行和不断完善,越来越多的公司推出基于MDA的快速开发平台,通过用户设计的模型和平台已有的框架,可以直接生成可执行的程序代码。本文围绕此类开发平台的数据
在信息量呈指数级增长的今天,我们需要数据库管理系统(DBMS)能够处理上G、上T、甚至上P的海量数据。这就对数据库管理系统提出了挑战,即如何有效地存储和管理海量数据并高效
工程设计过程中数据整理、数据查询、图形处理、文档编辑等工作己逐渐趋于应用专业软件来实现。根据目前具体设计行业的特点,设计过程中往往通过多专业人员的多人协同工作,来实
数据挖掘是数据库系统和数据库应用的一个有希望的、欣欣向荣的学科前沿。它是一个多学科领域,从多个学科吸取营养。进行数据挖掘的方法有许多,而RS方法便是其中的主要方法之一
随着CMP的出现,如何提升其运行效率和最大化并行性倍受国内外专家和学者的关注。系统性能的提升不仅与硬件平台有关,同时也离不开硬件平台上的优化软件设计,只有两者充分结合
本文针对应急决策支持系统中数据交换的需求,提出利用XML(可扩展标记语言)技术建立数据交换平台,用统一的方式,实现各个系统之间不同结构和格式的数据的相互转换,解决了数据
近年来频频爆发的恐怖活动、地震、洪水、火灾、流行性传染病、煤炭安全生产以及稳定输送电能中的重大事故等突发事件对人民群众生命财产和社会安全造成极大危害。突发事件妥
定位与路径规划是月球车导航的两个重要问题。月球车要实现在月面环境下自主导航首先必须时时刻刻清楚自己的位置,之后能根据当前环境规划出一条合理的路径。因此本文围绕着