【摘 要】
:
随着互联网的飞速发展,信息量的爆炸式增长,需要高效的科学计算,以满足快速挖掘有价值信息的需求。在传统的计算机上处理海量的数据需要很长的时间消耗和能量代价,如何快速高
论文部分内容阅读
随着互联网的飞速发展,信息量的爆炸式增长,需要高效的科学计算,以满足快速挖掘有价值信息的需求。在传统的计算机上处理海量的数据需要很长的时间消耗和能量代价,如何快速高效利用好海量的数据成为各行各业所面临的严峻考验。高效利用海量数据挖掘出有价值的信息成为工业界发展的必然选择。由Google实验室提出的MapReduce编程模型是一种快速、简洁、高效的大数据的处理方法。其通过对大数据块进行子任务划分、任务调配、并行化处理、容错处理等进行封装,很大程度上简化了并行程序的设计,目前已在Google、 Facebook、阿里巴巴等公司的许多项目中得到应用。相比较而言,传统的计算机其有限的运算单元和存储带宽,束缚其性能和功耗无法满足日益推成出新的应用需求。可重构计算架构的处理系统兼顾了专用集成电路的高效性和通用处理器的灵活性的优势,其可高效并行处理计算密集型应用的特点,成为解决并行计算多样性需求的有效途径。本文针对高效处理海量数据的场景下,对MapReduce编程模型和可重构计算技术进行了深入的研究;提出了将MapReduce编程模型与可重构计算技术相结合的研究方案;选取了Kmeans聚类算法和FIR滤波算法两种典型的算法作为目标算法;设计了Kmeas聚类算法和FIR滤波算法的MapReduce编程,完成了这两种算法在可重构硬件架构上的映射。完成了上述算法在可重构计算平台和通用计算平台ATOM230上的性能对比实验,实验结果表明:在可重构计算平台上实现基于MapReduce模型并行化的Kmeans聚类算法和FIR滤波算法在运行时间上较ATOM230通用计算平台分别提升3.2倍和2.6倍。
其他文献
计算机网络技术的发展,为数字作品的使用、传播提供了便利的途径。但同时也带来了非法拷贝和复制等网络信息安全问题。数字水印作为多媒体版权保护的一项潜在解决手段,最近几
随着社会的不断发展,人们对铁路交通系统提出了更高的要求,铁路系统的不断提速,运行机车在轨道线上的密度必然加大。论文通过轨道多载波调试解调技术的通信方式的研究,具有一
脑电信号蕴含着丰富的大脑活动信息,通过对脑电信号的研究,我们可以了解神经细胞电活动与人的生理和心理状态之间的关系,在临床医学和认知科学领域具有重要的科学意义。
体操机器人是非线性、非完整、强耦合、多状态、欠驱动系统,以及在稳摆区域属于自然不稳定系统。这类系统能反映出许多控制领域的关键问题。大量国内外的学者投身于体操机器
如今粉体加工技术已是支持高新技术产业的重要基础技术之一。现代工程技术的发展需求许多粒度极细且分布均匀,纯度高而污染低呈粉体状态的原料和制品。与传统的微粉生产方法相
本文概括介绍了支持向量机算法及逆系统方的相关内容,并针对支持向量机参数难以选择的问题,通过分析参数变化对支持向量机学习结果的影响,提出了一种改进的粒子群优化参数的
步行运动是最简单且最经济、最有效的健身方法,其速度及能量消耗是运动强度很重要的参数反映,实时监测步行速度与能耗是健康促进服务系统的重要技术环节。Nike联合Apple推出一
随着电力市场改革,各大发电集团面临着自负盈亏,这导致企业会以追求效益最大化为目标。而发电机组运行的经济性,则是影响企业经济效益的根本问题。在设备的众多指标中,自耗电作为一项不可避免但却能够节约的指标,一直受到人们的广泛关注。随着能源危机的加重和环境的日趋恶化,风电的发展得到了足够的重视,但是对于风力发电机组自耗电的问题国内外大部分风电场仍未进行深入的研究。本文主要以风力发电机组为研究对象,并针对每
运动生物力学信息的获取是运动生物力学研究的重要组成部分,国内外长期的研究实践表明,运动学、动力学等多种运动生物力学信息的有效集成,是复杂运动系统建模和仿真的基本前提。
随着传统化石能源的逐日枯竭,新能源逐步成为人类关注的重点,其中风能作为清洁性和可再生的能源逐步成为新能源研究的重点,由于风能能量密度低、随机性和不稳定等特点,所以对