论文部分内容阅读
近年来,随着人们利用信息技术生产和收集数据的能力大幅度提高,千千万万个数据库被用于企业管理、政府办公、科学研究和工程开发等等。但是与此同时,众多的数据也面临着一个严重的问题:激增的数据背后隐藏着许多重要的信息,但是人们如何才能更好的利用这些数据,避免“数据爆炸但知识贫乏”现象的发生呢? 数据挖掘技术是计算机技术发展的热点之一。通过对历史积累的大量数据的有效挖掘,可以发现隐藏的规律或模式,为决策提供支持,而这些规律或模式是不能够依靠简单的数据查询得到,或者是不能在可接受的时间内得到。这些规律或模式可以进一步在专业人员的识别下成为知识。数据挖掘面对的任务是复杂的,通常包括分类、预测、关联规则发现和聚类分析等。 随着互联网技术的迅速发展,电子商务的应用越来越广泛,其功能和范畴也逐渐由狭义的在线交易延伸到广义的基于网络的各种商务活动。电子商务系统构建技术不仅要支持系统的快速开发和重用,而且能通过数据挖掘等各种商业智能技术为企业的商务活动提供全面支持。因此研究如何提高软件系统的可重用性,并以可重用的组件和模式为基础构建通用电子商务系统开发平台,以及研究数据挖掘在电子商务系统中的应用具有重要意义。这也是论文的主要目的。 在论文中,主要讨论了以下几个方面的问题: 1.首先介绍了数据挖掘的基本概念及其和数据仓库、OLAP(联机分析处理)的关系。然后,结合电子商务给出了利用Microsoft SQL Server 2000的数据仓库和OLAP技术来建立客户行为历史数据仓库的方案,为基于决策树算法的数据挖掘提供干净的数据。 2.在论文的研究中,首先介绍了面向电子商务的数据挖掘的原型系统。然后,通过OLAP得到的数据集利用ID3算法的理论求解出决策树,最后通过客户端对数据挖掘模型进行分析和实现,为进一步构建完善的基于数据挖掘的电子商务系统做了准备。 最后总结了课题的主要工作和未来的研究方向。