一种Spark环境下的高效率大规模图数据处理机制

来源 :计算机应用研究 | 被引量 : 2次 | 上传用户:ddnihaoba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有的图处理和图管理框架存在的效率低下以及数据存储结构等问题,提出了一种适合大规模图数据的处理机制。首先分析了目前的一些图处理模型以及图存储框架的优势与存在的不足。其次,通过对分布式计算的特性分析采取适合大规模图的分割算法、数据抽取的优化以及缓存、计算层与持久层结合机制三方面来设计图数据处理框架。最后通过PageRank和SSSP算法设计实验,与MapReduce框架和采用HDFS作持久层的Spark框架进行性能对比。实验证明提出的框架要比MapReduce框架快90倍,比采用HDFS作持久层的
其他文献
现有社会网络隐私保护方法对大规模社会网络数据表现出隐私保护效果差、处理性能低等缺点,不能满足实际需求。针对这一问题,提出基于Pregel-like的社会网络隐私保护方法。该方
目的观察红蜡片固定疗法对耳廓假囊肿的疗效.方法对65例耳廓假囊肿病人采用穿刺抽液后再用红蜡片固定2周的方法进行治疗.结果63例病人经随访6个月~2年后未见复发,有2例病人复
为了实现无线传感器网络节点在不同忙碌状态(忙碌状态:节点一段时间内的忙碌状态时间与对应时间段的比值)的区域中均达到网络吞吐量的最优,对退避算法中退避窗口大小取值做了一定工作。基于节点忙碌状态的讨论,依据节点的吞吐量模型,通过分析不同网络负载区域影响节点吞吐量的因素,为使网络中节点的吞吐量更接近理论最大值,给出了基于不同忙碌状态的退避窗口设定算法MNLBA(multi-node-loading ba