基于密度和层次的快速聚类算法在数据挖掘中的设计及实现

来源 :信息安全与技术 | 被引量 : 0次 | 上传用户:yanzi774
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文在对各种算法深入分析的基础上,尤其在对基于密度的聚类算法he基于层次的聚类算法深入研究的基础上,提出了一种全新的基于密度和层次的快速聚类算法。该算法保持了基于密度聚类算法发现任意形状簇的优点,而且具有近似线性的时间复杂性,因此该算法适合对大规模数据的挖掘。理论分析和实验结果也证明了基于密度和层次的聚类算法具有处理任意形状簇的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的DBSCAN算法。
其他文献
轮轨作用力是列车对轨道状态的激励响应,是列车安全监控的重要信息指标,对保证列车的行车安全意义重大.现有的轮轨力采集设备存在容易磨损、使用周期短等问题,导致数据采集困
天津尖峰天然产物公司是一家专业从事天然植物提取、研究、开发、生产、销售的专业综合公司。目前是国内最大的葡萄籽提取物生产厂家,同时推出红景天提取物。红景天(Rhodiola)
文旅融合发展背景下,旅游演艺产业正逢重要的发展机遇期,如何激发主题公园型旅游演艺活动的活力,更好地引导和满足消费者的需求成为一个研究热点。以北京市欢乐谷为例,运用文
“我国大数据产业正在从起步阶段步入‘黄金期’,2020年中国有望成为世界第一数据资源大国。”权威数据显示,预计2020年我国大数据市场规模将超过8000亿元。在行业应用中,工业大数据的占比将达到6.64%。但大数据发展的“黄金期"仍然存在着多重“羁绊”。  阻力日渐明显  “随着大数据战略的深入实施,信息壁垒、标准缺失、无法可依、人才稀缺、应用不足等问题越来越成为困扰大数据产业健康发展的重大障碍。