【摘 要】
:
在现代信息社会中,每个行业都在不间断的产生海量的新数据。这些数据支撑行业的发展,也是科技创新的一个重要来源。大数据领域的基石就是存储、管理和分析数据的数据中心。无
论文部分内容阅读
在现代信息社会中,每个行业都在不间断的产生海量的新数据。这些数据支撑行业的发展,也是科技创新的一个重要来源。大数据领域的基石就是存储、管理和分析数据的数据中心。无论是只有几台机器的小型组织还是全球化的大型跨国公司,数据中心都是企业生产和发展过程中必不可少的设施。但是,随着数据中心的规模不断扩大,在全球资源紧张的大背景下,数据中心的能耗问题不仅导致成本增加成为制约企业发展的重要因素,而且成为经济增长和资源浪费的新兴矛盾对立面。数据库是传统意义上数据中心的主要应用,大型企业在数据中心上的数据维护都会产生巨大的开销,因此关注数据库系统的能耗表现是最近学术界热门的课题。数据库通过多个查询路径的代价评估,找出最优化的一个查询进行的方式即查询计划,因此如何根据查询计划估算出整个查询的能耗是整个数据库查询能耗相关研究的基础,也对于后续进行数据库查询的能耗优化研究至关重要。本文在大规模并行处理架构的Greenplum数据库机群环境下,首先分析了机群下数据库系统与单机环境下的差异,然后实验测试了数据库系统中主要能耗硬件在不同工作负载下的能耗表现情况。针对数据库查询中的不同查询操作,本文由实验得到不同查询操作与查询表规模的关系,从而将硬件能耗、查询操作以及表规模三者之间建立联系,再根据具体查询计划的执行方式建立能耗估算模型并且实验验证其估算结果的准确性。另一方面,通过对于整体数据库系统能耗的研究,本文实验测试连接操作中三种连接方式nestloop、mergejoin、hashjoin在表不同规模情况下进行连接计算时间上的差异。最后提出基于蚁群算法的机群多表连接次序优化策略。
其他文献
考试是对考生知识和能力水平的主要测量方式,它需要综合运用教育测量学、心理测量学、教育统计学和计算机科学等多学科的知识,科学、客观和公正地设计试题。现有题库管理系统
随着网络技术的发展,各种即时通信产品层出不穷,目前最常见的几种即时通信软件有QQ、MSN、yahoo messenger。由于它们的协议不是公开的,因此易形成信息孤岛。Jabber的提出打
水泥行业作为国民经济支柱产业之一,在我国国民经济中占据重要地位。2007年我国水泥产量为13.5亿吨。山东省一直是水泥生产大省,已连续多年稳居全国水泥产量第一的位置,2006年的
随着网络技术的飞速发展,分布式资源的应用与管理对网络性能提出更高的要求。在此背景下,微软在windows server 2000中引入活动目录技术,之后又在windows 2003中改进了活动目
Web使用挖掘是Web数据挖掘研究领域的重要应用研究方向之一。其旨在通过对Web日志进行有效的数据挖掘,发掘隐藏在日志数据背后的规律和用户访问模式,从而改进Web站点设计,向
无线传感器网络是一种用于监测指定区域环境信息的自组织网络,它通过在目标区域内抛撒大量的嵌有传感器的节点进行组网。由于传感器节点电量容量有限,因此随着网络的长时间不
决策支持系统(Decision Support System,DSS)是一种帮助中高层管理人员进行决策的计算机系统,这种系统综合运用了信息论、人工智能、信息经济学、管理科学、行为科学等学科的
随着计算机应用领域的扩大,软件规模及复杂性不断提高,提高软件生产率是当前软件产业的当务之急。为解决这个问题,软件复用是有效的办法。领域工程为软件复用提供了有力的技术支
三维地形可视化在地理信息系统、实时仿真及3D游戏等领域都占有非常重要的地位。随着遥感技术、卫星技术的发展,三维地形场景的几何数据和纹理数据量日益庞大。因此,为了实现大