论文部分内容阅读
在未来的发展中,卓越亚马逊旨在进一步丰富在线产品种类,从而以最丰富的货品、最具竞争力的价格和最优质的客户服务以及领先的世界级B2C购物平台,让消费者更加轻松愉快地享受到卓越网所提供的专业的网上服务。卓越亚马逊苏州公司此前仍然延续使用着卓越网的操作和管理系统,旧系统的操作流程和国外公司先进的操作模式有很大的差异,导致旧系统可以统计到的操作数据和数据分析的结果,对于苏州公司正确、有效地引进国外公司成功的管理经验几乎没有作用。由于苏州公司的前身是卓越网,有着自己单独的系统。如今,为了并入亚马逊并建成与亚马逊相兼容的系统就需要对新旧系统之间的数据进行数据迁移。原有的旧系统从启用到被新系统取代,在其使用期间往往积累了大量珍贵的历史数据,其中许多历史数据都是新系统顺利启用所必须的。数据迁移(ETL),就是将这些历史数据进行抽取(Extraction)、转换(Transformation),并装载(Loading)到新系统中的过程。本文首先对数据转换的方法及理论进行了概述,介绍了异构数据库迁移一些基本概念,然后对系统进行了详细的需求分析,研究了系统实现的可行性以及设计的原则,并最终确定了系统实现的方案。本文设计的系统基于JAVA技术开发,由于XML本身即可作为ETL工具抽取数据的来源又可以是加载数据的目的地,同时由于其本身的平台无关性,本文使用XML描述ETL抽取、转换、加载的各种信息,如源字段、目标字段、映射规则、转换流程等。在确定系统设计的方案之后,本文给出了系统的执行流程和业务逻辑。由于本系统是以XML文档为数据中间媒介,因此,本研究进一步制定了数据查询、清洗与数据迁移过程中所需要的XML文档的编制规范。最后,本文给出了系统的时序图、UML描述和界面的详细设计。鉴于数据清洗和数据迁移是本研究的核心模块,还给出了部分关键代码。本系统顺利完成了从卓越网到卓越亚马逊的数据迁移工作。由于系统的设计与开发是基于跨平台、可扩展性好的JAVA语言和XML规范,充分的应用了JAVA的面向对象特性,还预留了大量的接口,因此,具有良好的可扩展性,可以推广到很多其它的系统和解决方案。