数据流聚类中若干问题的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:chenhy8208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
硬件技术的飞速发展带来了一个新的问题,数据产生与获得的速度大大超过了数据处理能力。为此一类新型的应用——数据流应用应运而生,其中数据流挖掘以其实用性吸引了大量计算机研究者。 数据流聚类问题是数据流挖掘领域中最有活力的方向之一。本文讨论了数据流聚类三个方面的问题,首先针对任意形状的数据流模型聚类问题和当前著名数据流聚类算法CluStream的不足,提出了一种基于空间划分和组合的聚类算法ACluStream,然后针对数据流爆发现象提出了一种基于核密度估计理论和空间网格划分的数据结构——观察点矩阵,并为其设计了一种根据数据流流速大小自动调节运算精度的算法。最后针对现有多数据流聚类模型对数据流数目敏感的问题提出了一种全新的多数据流聚类模型——CMO模型。论文中对本文提出的算法与现有解决此类问题的方法进行了详细的分析、比较。理论分析和大量的实验结果都表明,本文的方法与现有方法相比有很大的提高。
其他文献
在众多的无线Ad hoc网络路由协议中,由卡耐基梅隆大学提出的动态源路由(DSR,Dynamic Source Routing)协议非常具有代表性。但是,其路由维护过程控制开销过大、链路失效判断也
随着互联网络和计算机技术的迅速发展,人类进入了以数字信息为特征的信息社会。信息时代在给数字多媒体创作和传播提供诸多方便的同时,也带来了一个严峻的问题——盗版和篡改。
人脸识别技术是利用计算机分析人脸图像,并从人脸图像中提取有用的信息进行身份识别的技术。人脸识别技术的任务之一是人脸鉴别,就是验证某个人的身份是否属实,是一对一的匹配过
数据挖掘是帮助人们在海量数据中发现信息和知识的工具。近年来数据挖掘技术成了智能研究的核心技术,被广泛应用到了诸多领域,引起了学术界极大的关注。在教育领域中,对学生
本文研究Java中对象模型到关系模型的映射问题,其目的就是在Java开发环境中建立一个持久层,将对象模型到关系模型的映射信息在程序代码之外进行集中封装。通过这样一种方式,
数据的爆炸式增长使我们进入了真正的数据与信息时代。如何从海量数据中获取潜在有用的信息,引导人们做出正确的决策,这就离不开数据挖掘。聚类则以其特有的优点,成为数据挖
随着计算机技术和通信技术的飞速发展,P2P(peer-to-peer,对等网)取得了巨大的成功。P2P在分布式搜索、分布计算、协同工作等方面的优点尤为突出。然而,由于P2P的安全性一直以来
软硬件划分是软硬件协同设计的关键环节,划分的结果直接影响目标系统的设计质量。由于单个任务具有多种不同的硬件实现方式,与传统的单一硬件实现方式的软硬件划分问题相比,多选
近年来,随着网络技术和Internet的迅速发展,基于Browser/Server结构的Web应用,因其具有易用性、通用性和良好的可扩展性等优点而发展迅速,正逐渐成为实现企业应用信息系统的
传统的企业由于缺少不同系统相互集成的技术,导致很多关键的信息被封闭在相互独立的系统中,部门间重复着冗余的工作,这直接导致了企业工作效率的降低和运营成本的上升。企业的业