数据并行程序正确性分析与网络流量优化

来源 :清华大学 | 被引量 : 0次 | 上传用户:yourice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据并行编程模型以其简单的特点在大数据计算领域获得了广泛的应用。但是,编写用户自定义函数的串行思维与实际的并行执行之间存在显著的差异,使得程序员容易忽略并行执行中的不确定性和通讯开销,并引入正确性与性能方面的问题。本文分别从这两方面问题入手,发现并改进了现有工作的不足。本文的主要工作包括:(1)针对并行执行不确定性引起的正确性问题,本文从上万个真实数据并行程序中提取了507个不同的Reduce函数并进行了人工分析,发现了大量并无正确性问题的不可交换Reduce函数,否定了现有工作关于不可交换Reduce函数必为程序缺陷的假设。此外,本文进一步发现了5种不可交换模式,以及部分模式依赖特定隐含数据性质保证确定性的特点。通过检查实际数据上的性质,本文成功发现了5个长期隐藏在产品环境中的真实程序缺陷,并讨论了改进现有测试方法的思路。(2)本文提出了Cybertron,一种动静态结合的数据并行程序网络流量优化技术。通过结合静态程序分析结果和运行时动态信息,Cybertron克服了现有静态技术在处理实际程序中面临的限制,通过在运行时精确跟踪给定运算对数据的使用情况,更细粒度地过滤无用数据,并使用数据约束编码的技术对数据进行更高效的编码。它在合理的运行时开销下显著提高了现有方法对数据并行程序网络流量的优化效果,并在各种网络环境下有效提高了程序性能。
其他文献
防火墙是最常用的安全技术产品之一,其作用是阻断外部攻击进入内部网络。使用防火墙,最重要的是正确配置防火墙策略。可是,防火墙策略的语义不明问题,导致配置防火墙策略是一
介绍了介孔SiO2(M-SiO2)材料的制备方法及其在聚合物阻燃中的应用进展,其制备方法主要有溶胶-凝胶法、水热合成法、室温合成法、微波辐射合成法4类,文中分别阐述了这4种方法
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
《中医骨伤科学》作为中医专业临床上实用型较强的一门主干课程之一,在教学过程中改进教学方法,理论课采用综合案例教学法、综合实训课采用模拟教学法、实践课采用床边教学法
农业生产机械化是提高农业生产效率和农民收入水平的有效手段之一。农机推广是实现农业生产机械化和现代化的主要途径,重视农机推广工作,提升农机推广工作水平,以实现农机推
论文对用户科学数据素养、认知视角下用户信息素养研究的国内外现状进行了梳理,构建了认知视角下用户科学数据素养研究架构。在此基础上,重点探讨了认知视角下用户科学数据素
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
【目的】探讨酿酒酵母YSI-3.7在富集Cr(Ⅲ)形成葡萄糖耐量因子(GTF)过程中自身抗氧化机制以及硫在该过程中发挥的作用,以期揭示硫对降低铬胁迫,进而提高生物富铬的作用机理。