高维稀疏聚类知识发现及其在连锁超市中的应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:hero18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量数据中提取人们感兴趣的信息和知识,这些知识往往是隐含的、有用的、尚未发现的信息和知识.数据挖掘已经引起了人们的广泛关注,目前成为国内外数据库和信息决策领域的最前沿研究方向.聚类是数据挖掘领域最为常用的技术之一,用于发现在数据库中未知的对象类.聚类是现实世界中普遍存在的现象,其应用非常广泛.本文主要围绕高维聚类对数据挖掘的理论和方法进行了以下几方面的工作:首先归纳了数据挖掘技术的发展状况,包括数据挖掘的定义、数据挖掘的流程、功能等基本概念和技术,而且还探讨了数据仓库和数据挖掘的关系.数据仓库作为一种新型的数据存储方式,为数据挖掘提供了新的支持平台,其内在的对决策的支持能力,为数据挖掘开辟了新的空间.其次对聚类问题进行深入地研究.迄今为止,人们提出了许多用于大规模数据库的聚类算法.其中大多数算法可以高效地处理低维数据,但是随着数据的维数增加,它们的执行效率将会急剧下降.而少数可以处理高维数据的算法却存在效率低下或聚类结果质量差等问题.通过对高维聚类问题的深入研究及对已有高维聚类算法的分析比较,本文提出了一种可以高效地处理高维稀疏聚类问题的基于特征标识的聚类方法(SCM).最后论述了SCM聚类方法在连锁超市中的应用,其中构建了同时支持营销分析及多维数据分析的数据模型,基于该数据模型的数据存储,直接为发现聚类知识提供了高质量的数据源.
其他文献
在军事指控领域中,伴随着硬件规模和复杂度的不断加大,以及苛刻的实时性能需求和各个平台之间实时要求的巨大差异,对于硬件平台之上的实时操作系统要求越来越高.但是当前的实
在本文中对已有两种算法进行研究和分析的基础上,提出了一些新的建议。本文的工作大致可以归纳如下:① 在系统算法中给出一种新的启发策略,并实现了修改后的算法。同时,用部分实
本文完成了一个基于Clark&Wilson模型的信息管理安全子系统(SSBCWM)的设计和实现.这一模型通过密切结合密码保护,触发器结构和改进的物理存储机制增强了数据库管理的安全性能
本课题旨在用π-演算对openMosix的一些基本特征进行解释,选取了进程迁移作为切入点,重点研究在进程迁移的情况下,进程间的互操作关系,用π-演算给予了形式化的描述。本文的主要
本文介绍了构造Java企业级系统的最新平台——J2EE,详细阐述了它的组成、基于J2EE构建企业系统常用的主要技术,包括Servlet、JSP、企业JavaBean和一组常用API;研究了J2EE的在企
语义网以XML为基础,用RDF统一资源描述格式,并以Ontology作为词汇共享与语义交换的媒介。本文首先对语义网作了简要的介绍,内容包括语义网的基本概念、层次结构及应用。对URI、X
本文所构建的协作学习系统,是OGSA在远程教育中的实际应用。本系统是一种开放的、可扩展的、适应网络教学需求的协同教学系统,通过各个专门功能的Web Service,建立相关工具集来