论文部分内容阅读
随着互联网技术飞速发展与成熟,电子商务也以迅猛的速度在发展、普及,电子商务作为拓宽市场的新手段已经渗透到了各行各业当中。在电子商务交易的过程中,业务数据被记录到数据库中,这些数据不单单是作为交易事实的记录,其背后更蕴藏着大量十分有价值的信息,这些数据对于分析用户的消费倾向,商品的销售情况都很有帮助,数据仓库正是以此为目的而建立,通过对大量历史数据的分析,挖掘出业务数据背后的隐藏信息。数据仓库是面向主题的、集成的、相对稳定的、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。数据仓库将业务数据库中的数据通过抽取,转换,放入到数据仓库中。数据仓库将企业的数据按照特定的方式组织,从而产生新的商业知识,这些以数据为基础的知识,主要应用于对市场战略的评价,和为企业发现新的市场商机,同时,也用来控制库存、检查生产方法和定义客户群,从而产生新的商业知识,并为企业的运作带来新的视角。数据仓库的建立使信息容易存取并且有使用价值,对数据仓库中的数据进行多维分析可以给管理者对下一步的销售决策提供很多帮助。宝钢现货钢材在线贸易平台(以下简称钢贸平台)是电子商务模式在钢材交易上的一次突破性的应用,是用电子商务的方式取代传统的面对面和电话销售的方式对库存剩余钢材现货进行在线销售,更快捷方便的将库存的现货销售出去,在其运行的几年中已经占据了宝钢公司钢材现货交易中很大一块份额。这样的新型销售方式在取代了原有的通过人与人交流的销售方式的同时,也失去了许多有价值信息,如客户消费倾向、阶段性市场需求等等。数据仓库的建立就是要将这些信息通过多维数据分析,从数据中挖掘出来,将数据库中记录一系列有用的交易信息用于分析,以此控制销量和收益。本设计主要研究钢贸平台数据仓库的建立与对其数据的多维数据分析。首先介绍数据仓库与多维数据分析的概念以及其在电子商务中的应用。在理论基础上,针对钢贸交易平台,根据不同的分析主题进行讨论,分别建立数据模型。详细设计钢贸平台的业务数据的ETL (Extract抽取,Transfer转换,Load载入)过程,并使用SQL语句实现,将处理后的业务数据导入数据仓库中。文章最后简要介绍根据需求指定的多维数据分析方案,并将经过多维数据分析的结果通过报表展示出来,在多种分类算法中选择合适的算法进行数据分类与挖掘,根据算法结果给出决策意见与钢材的定价方案以支持销售模式的改进。