面向数据密集计算的Java虚拟机性能分析与优化

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：huihui1989

【摘要】

：

“大数据”时代的到来对于应用进行海量数据处理带来了新的挑战。为此,学术界与工业界设计与实现了多个大数据处理框架以简化大数据处理。为了编程的便捷性与系统的稳定性,当

【作者】

：

雷天洋

【出处】

：

上海交通大学

【发表日期】

：

2004年期

【关键词】

：

Java虚拟机数据密集应用 Java对象布局垃圾回收数据抽象

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

“大数据”时代的到来对于应用进行海量数据处理带来了新的挑战。为此,学术界与工业界设计与实现了多个大数据处理框架以简化大数据处理。为了编程的便捷性与系统的稳定性,当前主流的大数据处理框架如Spark,Hadoop等均使用管控式语言如Scala、Java等进行编程。然而,由于Java虚拟机(JVM)等管控式语言运行时环境需要进行数据抽象、内存管理等,通常对于大数据应用带来了较大的性能开销。同时,由于JVM等提供的额外数据抽象增加了大数据应用与硬件间的语义鸿沟,也使得大数据运行时不能充分挖掘硬件提供的并行性。具体而言,本文在分析以上Java虚拟机以及数据密集型应用运行的过程中,发现了三个不足点:1.为了支持垃圾回收,JVM为运行时代码添加了额外的指令开销。分代式垃圾回收在对年轻代进行回收时,需要遍历老年代到年轻代的引用。这个引用是通过卡表的数据结构完成的。而在程序运行过程中,Java虚拟机需要插入额外的写屏障代码完成卡表操作。2.Java对象布局上存在一些额外开销。为了支持Java虚拟机上的类型安全、垃圾回收等特点,Java对象在布局上需要一个对象头来完成功能。而这个对象头在不使用时将对对象数据的局部性以及访存性能造成影响。3.即时编译器的优化限制性,语义识别不够,不能为上层大数据应用提供较多优化。并且,在Spark框架中,操作还是基于单个元素;不能高效地针对大数据场景进行扩展,也不能使编译器挖掘更多语义进行优化。针对上述问题,本文提出了三个相应的解决方案:1.基于硬件虚拟化技术消除写屏障的额外指令开销。该方案利用垃圾回收中卡表功能与页表功能的相似性。利用硬件虚拟化中客户页表的支持,将页表复用为卡表结构。因此在原有垃圾回收读卡表时,只需要读取页表脏位即可。而由于页表是通过硬件维护,Java虚拟机不再需要生成写屏障。可以在应用运行时省去执行屏障的开销。2.分离式对象内存布局。该布局将对象头和对象数据分开分配在堆中,这样对象头将对对象数据的读写没有直接影响。本文提出了三种运行时对象数据获取方法,并以性能为考量选取其中一种进行实现。使用这种方式,对象数据访问将没有额外开销。当应用只需要使用对象数据时,可以提升对象数据的内存局部性,整体提升访存性能。为了处理分离式对象和正常对象的混合情况,Java堆也被分为正常对象区域和分离式区域,存放对应的对象。3.针对大数据机器学习框架提出超向量的运行时技术。该数据抽象将多个向量聚合在一起,并提供粗粒度的超向量操作。在此基础上,新提供的操作可以针对数据密集计算场景提供优化的语义,如密集计算场景中经常有“多对一”的语义,而使用超向量的操作可以充分挖掘这层语义。超向量还可以促使更加优化的实现,编译器由于获得了更多语言层语义,可以对计算生成更多优化代码,如生成了更多SIMD指令,提升整体的计算性能。以上三个方案均已在JVM以及相应大数据运行时中实现并进行测试。

其他文献

毛果杨HDA909基因的克隆及功能分析

本研究从毛果杨中克隆了组蛋白去乙酰化酶(HDAC)的RPD3/HDA1亚家族基因HDA909,研究了其蛋白质序列、基因的表达及在干旱和真菌胁迫应答反应中的功能。(1)毛果杨HDA909基因的O

学位

毛果杨组蛋白去乙酰化酶基因功能干旱真菌胁迫

Connected Standby在超极本BIOS里的设计与实现

近十年来,随着智能手机的普及,个人电脑也在走向一条革新之路,超极本Ultrabook就是在这种情况下诞生的,旨在为用户提供低功耗,高效率的移动生活体验。随后不久,微软提出了连

学位

连接待机超极本BIOSS0低功耗空闲模式实时设备低功耗状态

125I粒子植入治疗非小细胞肺癌前后CEA、CYFRA21-1变化与临床疗效评价

目的评估CT导引下125I粒子组织间植入联合支气管动脉灌注化疗治疗中晚期非小细胞肺癌（NSCLC）患者前后CEA、CYFRA21-1水平变化及临床疗效。资料与方法选择分析我院2013年1月～2017

学位

125I粒子非小细胞肺癌支气管动脉灌注化疗术癌胚抗原细胞角蛋白19片段

LDPC码置信传播译码算法的改进及性能研究

低密度奇偶校验（Low-Density Parity-Check,LDPC）码是一种逼近香农限的信道纠错码。因构造的H矩阵中1元素密度很小,所以LDPC码的编译码复杂度低、易于硬件实现。到目前为止,LDP

学位

LDPC码BP译码算法纠错性能译码复杂度净编码增益

lncRNA AWPPH通过上调TGF-β1表达促进NSCLC术后远期复发

原发性支气管肺癌是一种最常见的恶性肿瘤,它源于肺泡上皮或(和)支气管粘膜上皮,简称肺癌。WHO发布的《全球癌症报告2014》显示肺癌的发病率在男性人群中位居第一,在女性人群

学位

非小细胞肺癌复发长链非编码核糖核酸转化生长因子-β1

《文選集注》引《說文》研究

本文在逐條1錄《文選集注》徵引《説文解字》(以下簡稱《説文》)條目後,統計得到:《文選集注》徵引《説文》172例,合155字,其中李善注117例,《文選鈔》(以下簡稱《鈔》)52例,《音决》2例,陸善經注1例。對《文選集注》徵引《説文》的內容進行仔細分析並與今大徐本《説文》進行認真比對後發現,《文選集注》中各注家使用的《説文》版本與今大徐本主要依據的版本是基本一致的。通過考證引文與今大徐本有差異的

学位

《文選集注》《説文》《文選鈔》李善注徵引

异构可重构处理器C语言自动转换与优化变换技术研究与实现

通用处理器的处理速度已经越来越不能满足计算密集型应用的需要,而面对纷繁复杂的应用程序,专用集成电路的设计速度已经不能跟上应用的更新速度,所以可重构处理器依靠其灵活

学位

可重构编译器代码自动转换循环优化

基于惯性稳定平台的移动视频采集系统设计

基于惯性稳定平台的移动视频采集系统用于对视频采集图像稳定度存在特殊要求的场合,如无人机航拍图像采集、机器人视觉导航、动基座天线定向等领域。传统的惯性稳定平台是一

学位

稳定平台视频采集卡尔曼滤波

枯草芽孢杆菌的低分子肽对鲜切南瓜保鲜的研究

本实验研究了枯草芽孢杆菌分泌的上清液中肽与其低分子肽抑制鲜切南瓜上的霉菌和延长其保鲜期的作用。枯草芽孢杆菌上清液(BC)的低分子量滤液组(LC

学位

枯草芽孢杆菌β-13-葡聚糖合成酶辣椒疫霉菌产黄青霉菌

可撤销的属性基签密方案研究

近年来,属性基签密(Attribute-Based Signcryption)作为公钥密码学中新兴的密码学原语,以其独有的优势引起了研究者的广泛关注。属性基签密体制是属性基加密和属性基签名体制的复杂组合,其完美地继承了属性基加密和属性基签名体制的优点,既能提供细粒度的访问控制,又能提供机密性、真实性、可认证性和不可伪造性的安全性需求。而在计算开销和通信开销上却显著低于传统的“先加密后签名”或“先签

学位

云计算属性基签密可验证外包技术用户撤销功能服务器辅助签名功能

面向数据密集计算的Java虚拟机性能分析与优化

其他学术论文