基于Hive和Shark架构的UDF优化技术

来源 :南京大学 | 被引量 : 0次 | 上传用户:yetigai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着分布式大数据框架(如Hive)的日益成熟,大数据框架上的优化技术也得到了迅猛的发展。本论文介绍的UDF优化技术是大数据框架上的优化技术之一,通过对Hive和Shark框架中的UDF调用过程和执行过程的优化,来赋予框架更快的UDF处理性能。开源Hive+Shark框架在UDF相关模块有着诸多问题,如UDF调用上有额外开销,UDF的计算性能低下,UDF嵌套时性能超线性下降。为解决这些问题,本文从UDF的调用和执行过程出发,提出四种UDF优化技术,分别是UDF泛型化技术、二进制代码调用技术、UDF向量化技术、代码生成技术,旨在优化整个框架的UDF执行效率。UDF泛型化技术,通过省去UDF包装过程来提升UDF的调用效率,同时让UDF可接受的参数类型更丰富;向量化技术,在一次的UDF调用中处理多行数据,大幅减省UDF的调用次数;二进制代码调用技术,以高效的二进制代码替代UDF中的计算逻辑,让UDF计算过程占用更少的内存,结合向量化技术可以获得更好的性能;代码生成技术的意义在于运行时生成一些嵌套UDF的执行逻辑,用于处理原本表达式树中的UDF,从与向量化技术不同的另一个维度减少了 UDF的调用次数。实验数据证明,四项优化技术分别解决了相应的问题,都带来了 UDF的执行效率提升,虽然提升效果不尽相同。其中的3项技术已应用到实际产品中。
其他文献
近年来,二氧化钛(TiO_2)材料因其成本低、无毒、化学活性好、稳定性高等优点,在光催化降解、光解水制氢及太阳能电池等领域得到了人们广泛的关注与研究。其中,高能{001}面暴露的TiO_2纳米材料因具有独特的“表面结构”和更优的表面化学活性,展现出比常规TiO_2纳米材料更为优异的光电化学性能,更具潜在的应用前景。但如何获得尺寸均匀且{001}面暴露比率高的TiO_2纳米材料一直是困扰科研人员的重
在知识经济的背景下,创新是加强国际竞争力的重要手段。一方面,创新政策体系的建立与完善日趋重要,创新政策的组合化趋势也得到了广泛关注。另一方面,创新政策出现需求方复兴,需求侧创新政策工具的运用被深入讨论。在众多的创新政策工具中,公共采购已经得到许多国家和地区的承认,从公共组织购买的对象来看,公共采购分为商业前采购(PCP)与公共创新采购(PPI)。PCP和PPI作为新兴创新政策工具,研究二者对技术创
前言改革开放40年物业行业蓬勃发展、加急速扩张。物业企业如雨后春笋般涌现,行业规模逐年扩大,成为国民经济第三产业中的重要支柱产业,也被誉为朝阳产业。近几年,各大物业企
会议
人类对浩瀚海洋的深入探索和利用推动了水声通信扩频技术的蓬勃发展,水声扩频通信技术作为一种挖掘海洋世界的有效手段,成为海洋科研中的热点之一。隐蔽性高和抗干扰能力强是扩频通信技术的优势,它可以克服恶劣的信道条件,在低信噪比下实现可靠的信息传输。尽管具有高可靠性,但是传统扩频通信系统能够容纳的用户数受限且通信速率低。多载波调制技术的频谱利用率高,并且对于频率选择性衰落导致的多符号间串扰和多途干扰具有很强
石墨烯是sp2杂化单原子层的二维晶体,具有优异的机械强度(1.1 TPa)、快的电子传导速率(106 S cm-1)和高的导热性(5300 W m-1 K-1),兼具高比表面积(2600 m2g-1)、高透明度(97.7%)、结构稳定等,近年来引起了科学研究人员的广泛关注。本论文以石墨烯为基础材料,开展对自组装三维(3D)石墨烯功能材料及性能研究,发掘其在压力传感器、超疏水材料和太阳能水清洁等方面
近几年来人们已经认识到,由于真空的量子反常效应,量子色动力学(QCD)可能存在CP破坏效应。这一效应在强磁场下会表现为手征磁效应(chiral magnetic effect)。高能重离子对撞实验能够提供手征磁效应所需要的高温高密极端环境和瞬发强磁场,是研究手征磁效应的非常好的场所。手征磁效应预言在夸克-胶子等离子体中将出现沿着磁场方向的电流,从而导致末态强子系统的电荷分离效应。而手征磁效应对电荷
近年来,TPRS教学法(Teaching Proficiency through Reading and Storytelling)在英语、西班牙语等第二语言教学课堂中被广泛运用,但在汉语课堂中使用较少。本文以泰国清迈府地区三大学校的成年学生为研究对象,基于案例分析和教学实验,研究TPRS教学法对成年学生汉语口语课的教学效能。本论文共有四个部分,第一章绪论部分阐述选题缘由及研究方法,对TPRS教学
埋地管道是长输管道的重要组成部分,已成为我国经济发展的重要支撑。埋地管道需要通过焊接技术分段连接,由于施工现场环境湿度、焊前预热和焊后保温难以控制,管道的环焊缝容易产生各类缺陷。一旦发生土体沉降,埋地管道极易在焊缝缺陷处发生断裂破坏。近些年,强度高、重量轻的复合材料已广泛应用于缺陷管道的补强。复合材料补强作用主要依靠复合材料-管线钢界面进行载荷传递,一旦界面发生大面积失效,将会严重影响复合材料的补
地震灾害的破坏范围大、预测性不强、瞬间破坏力高,加上我国乡村聚落房屋建筑的防震抗灾基础设薄弱、防灾措施不足,当强烈的地震发生时,地震灾害对乡村聚落房屋建筑造成的巨大破坏将无法避免。当地震造成了原有乡村聚落民房倒塌、居住环境的破坏时,为了使种群得以延续,往往乡村聚落会摒弃祖辈选择居住地的原则向未受震灾影响的区域迁移,从而改变其原始的分布形式,新形成的乡村聚落分布特征在聚落防震减灾方面的能力得到了大幅
本文在分析国内外新型智能化电控固体推进剂技术研究概况的基础上,重点从能量性能、力学性能、安全性能、燃烧性能等方面介绍了湖北航天化学技术研究所在该推进剂技术方面的
会议