论文部分内容阅读
商务智能是计算机在大型企业商务中应用的一个新兴的领域。商务智能的任务是使用各种人工智能算法(如聚类、关联规则、分类等)对企业的大量数据进行分析从而发现商务对象(如供应商、客户、产品等)的特征并挖掘相关的商务模式。使得企业可以获得更大的利润并增强企业的竞争力。 一般商务智能过程包括几个阶段:ETL(抽取、转化和装载),数据仓库,OLAP(联机在线分析处理),数据挖掘和报表。差不多每一个过程都要涉及到大量的企业数据的处理和计算,使得整个商务智能过程具有高度的计算复杂度。数据挖掘与知识发现是商务智能过程中的一个重要阶段,其中各种机器学习算法被应用于转化后的结构化企业数据,从而可以发现直接从企业原有的数据中不是很清楚的一些有用的结果。由于商务智能通常需要处理的数据量很大而月.非常耗时,一般需要高性能的硬件配置。计算资源的有效利用是在设计商务智能软件系统时要考虑的非常重要的一点。 商务智能的研究和工业界的开发到现在已经超过10年的历史了。然而因为以上的困难,商务智能的真正应用价值直到最近才受到广泛认可。现有的商务智能软件往往功能过于单一,仅能完成具体的几个简单应用,无法解决一般性问题。同时,由于商务智能相关概念和流程过于专业,以至于一般用户很难操作。现有商务智能软件中存在的另外一个问题是这些软件往往过于专门针对具体的企业应用,为不同的企业就要开发不同的软件,导致了难以想象的软件开发困难。 为了解决这些问题,我们设计并开发了一套基于网格计算技术的通用商务智能服务平台。我们的目标是构建一个为各种企业用户提供商务智能服务的通用的平台。通过构建这样一个半台向企业用户提供商务智能应用的原子服务。企业用户可以使用这些原子服务来构建上层应用级别的商务智能任务并分析该企业自己的数据。企业用户享受的是按需服务的体验,避免了购买传统商务智能软件中往往有一些功能并不需要的情况。此外,网格计算的架构提供整合底层的计算资源的工具,能够最大化资源利用率与系统计算能力。通过将具体的商务智能任务分解为基本的原子任务,可以在一个统一的商务智能框架内用一种标准化的开发过程实现各种商务智能任务;而传统的商务智能软件往往包含了大量的重复劳动。另一方面,采用这种平台架构可以很容易的构造服务器集群或添加内存等硬件配置来提升所有商务智能应用的整体性能。 网格计算是分布式计算领域内的一个新兴的概念。主要用于为分布式计算提供了一个基础设施来集成可用的分布式计算资源并为用户使用这些资源提供按需服务。网格计算领域目前仍然处于不断探索阶段,并不是十分成熟。现有的网格计算应用中Web Service是一项重要技术。我们的平台通过使用Web Service技术来构建我们的商务智能服务。 我们也在商务智能服务平台的上面开发了一个客户端样例应用软件。该应用软件通过调用商务智能平台提供的商务智能服务来实现具体的商务智能应用。样例应用软件基于一个ERP系统的数据库而构建。