基于剪枝技术的PPM预测模型

来源 :郑州大学 | 被引量 : 0次 | 上传用户:xiao5playgame
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
解决Web访问延迟问题的主要方案是缓存技术和预取技术。虽然缓存技术在互联网上有着非常广泛的应用,但是随着WWW上动态内容和个性化服务的比重日益增加,缓存技术对网络性能的改善已不再显著,而预取技术是缓存技术的一种有效补充手段,是突破缓存性能上限的最有效的方法,正越来越成为Web加速技术领域研究的热点。然而预取技术在实际应用中必须解决好两个问题,一是准确预测——决定哪些Web对象值得预取;二是适时预取——根据系统资源状态适时决定实际预取的Web对象及预取的数量。本文针对这两个问题在对Web对象浏览特征进行了深入研究的基础上,提出了一种基于剪枝技术的自适应PPM预取模型,改进了现有的PPM预测模型和预取算法,从而以相对小的网络流量增加率获得相对好的访问延迟缩减率。由于模型自身的自适应性,些模型可用于在线预取中。 论文首先介绍了Internet和WWW起源、发展及现状,提出了互联网所面临的问题及解决方案。然后阐述了预取技术的基本概念及预取系统的分类与结构,并总结了现有的预测算法和预取控制策略。 在简单介绍了现有预测算法和预取控制策略之后,论文重点对Web对象浏览特征进行了深入的研究及实验验证。Web对象浏览特征主要表为用户对web对象访问呈不均匀性,存在某些热点,即Web对象可分为高频区和低频区,并且Web对象高频区和低频区流行度特征分别符合Zipf第一法则和Zipf第二法则;用户在一个网站中的浏览深度是一个随机变量,它服从逆高斯分布态分布。对Web浏览特征的深入研究,为本文提出的预测模型提供了理论依据。 基于Web对象浏览特征,本文提出了基于剪枝技术的PPM预测模型。该模型的核心是基于Web对象浏览特征的PPM预测模型,这种新的预测模型除继承了传统PPM模型简单易实现的特点外,利用Web流行度特征及描述用户浏览深度特征的逆高斯分布,模型在构造过程中对噪声页面及过期数据进行动态移除,分别从纵向和横向上对PPM预测模型规模进行合理控制。实验表明该模型较好地动态预测用户的Web浏览特征,不仅预测准确率和存储复杂度方面都有一定程度的提高,而且有效控制了由预取引起的网络流量。 最后,论文对提出的预取模型在真实Web日志中进行了实验,并对实验结果进行了分析。
其他文献
计算机和高速网络的日渐普及使得聚集地理分布的资源以形成计算网格成为可能。由于网格的巨大计算潜力,网格及相关技术得到了飞速发展。但是如何将这一潜力无缝地提供给用户是
本课题所研究的是一个燃油试验台的计算机测控系统,这个测控系统用来对与被测产品相关的物理量进行检测和控制。本系统要求对被测燃油阀门的前压力、后压力、线圈电流和电压等
现代战争对军事物流提出了更新、更高的要求,加强对军事物流,特别是军事物流一体化的研究显得格外紧迫。 军事物流信息的一体化管理是军事物流一体化的重要组成部分。军事物
随着现场总线技术的推广应用,分布式控制系统发展成为一种开放的、彻底分散的现场总线控制系统,控制子节点不再是进行信号转换、设备控制的简单系统,而是具有一定智能化和通
The Wireless Sensor Networks (WSNs) have become one of the active technologies and been exploited by the various applications.In WSNs, the data, which are sense
消息传输界面MPI是目前使用最广泛的并行程序设计平台,包括点到点通信和集合通信两种模式。作为并行计算的基础,通信的性能对于并行应用程序性能有着重要的影响。MPIAllgather
大学信息化建设初具规模后,随着应用需求的增加和资源的积累,又由于各部门的数据分别分布在不同系统的不同数据库中,因而数据交换与共享的需求日益提高,建设集中的异构数据集
随着航空航天技术的发展,利用卫星和飞机拍摄的图像已经是人类获取地面信息的重要手段之一,遥感图像具有覆盖面积大、内容丰富等特点。本文研究的内容是基于遥感图像的匹配,
云计算的影响正与日俱增,这项新兴的科技吸引了广泛的关注是因为它具有其它任何科技所没有的优点。  转移科学工作流到云环境中,可以使得世界上不同地方的科学家像一个团队一
多媒体技术和网络技术的发展,给人们带来了丰富多彩的视听娱乐数字产品。但是由于数字产品复制不会引起质量下降,因此出现的大量盗版现象,严重地损害了生产商和著作者的积极性,数