论文部分内容阅读
随着IT技术的不断进步,计算机系统在国民经济和人们的日常生活中扮演着越来越重要的角色,同时也产生了越来越多的数据。据wintercorp公司调查,世界上最大的数据库的规模每两年翻三番,我们真正进入到“海量数据”管理的时代。数据规模从过去的GB级进入到TB级,目前正接近PB级。网络监控、电子商务、实时数据仓库都成为海量数据的重要来源。另一方面,快速发展的计算能力和不断提高的存储密度使海量数据的处理成为可能。OLTP是传统关系型数据库在海量数据传输的主要应用,但是随着数据传输技术的发展,该技术严重地制约了信息系统的性能,虽然可采用提高单机的硬件配置和优化数据库系统性能参数的方法对系统性能进行改进,但是效果并不理想。因此,数据库集群技术日渐成为数据库研究领域的主要内容,基于多机并行处理的数据库集群以及较高的性能、较强的可用性和可扩展性在高性能计算、海量数据的存储和处理、Web服务、电子商务等领域发挥着巨大的作用。上述应用中的数据都是随时产生的,因系统规模巨大,数据的产生速率很高。这些数据需要及时地保存起来并进行统计分析以得出有效的信息,因此需要大量的数据扫描和计算,传统的单一并行数据库难以处理如此规模的数据。本文机群并行数据库中间件ERAC是一种无共享(shared-nothing)结构的并行数据库软件。它采用Oracle数据库作为数据处理的单元,将数据并行地写入若干个独立的同构数据库,查询时并行地读取和处理这些数据,从而极大地提高了系统存储数据的能力并缩短单个查询的完成时间。通过提高单个数据库节点的硬件配置和增加数据库节点的个数可以实现数据容量和处理能力的扩展。ERAC配置单独的加载和查询等服务节点,通过配置合理数目的服务节点可以充分发挥数据库节点的存储和处理能力,并提高系统的总体服务能力。负载均衡将用户请求分发到不同中间件服务器上。用户可以通过ERAC提供的类似JDBC的编程接口和实用工具集透明、有效地访问并行数据库系统。