论文部分内容阅读
互联网的设计理念可以上溯至上世纪六七十年代,当时计算机硬件相对比较昂贵,互联网的出现使得通过网络互联实现硬件资源共享成为可能,TCP/IP体系架构作为互联网中广泛应用的架构,也得到了世界范围的认可。经历五十多年的发展,互联网已经成为支撑人类社会发展的重要基础。但是TCP/IP体系架构在互联网中的核心地位从来没有发生变化。然而,随着计算机硬件成本的降低,人们对于硬件资源的共享需求已经逐渐淡化,更为关注的是互联网能够带来的信息和服务。随着云计算、社交网络、物联网等网络新技术的涌现以及视频点播、时移电视等业务流量的高速增长,互联网用户的基本需求由端到端的网络互联转变为以用户驱动的信息获取。目前基于TCP/IP体系架构的CDN和P2P技术主要用于解决内容分发和文件分享的问题,但是以覆盖网络的方式传输占据网络最大比例的内容业务流量,仍然存在传输效率低下的问题。为了适应互联网技术的发展和用户需求本质的变化,学术界近些年来提出一种以内容为中心的未来网络体系架构,即内容中心网络。在内容中心网络中,用户并不关心内容在网络中的位置,而内容本身才是用户最关注的。用户需要获取内容时直接向网络发送内容请求,网络中任何能够响应请求的内容源都可以将内容返回给用户,完成信息传输。为了达到以内容为中心的设计目标,内容中心网络中所有的网络节点均内嵌地支持缓存功能,向网络提供泛在化和透明化的缓存服务,在降低用户获取内容所需时间的同时实现减少网络重复流量的目的,缓存技术也成为内容中心网络中的关键技术之一。本论文对内容中心网络中的缓存技术进行研究,着重解决缓存的替换、放置和定位这三个具体问题。在单一节点中如何淘汰旧的内容以容纳新到达内容,是缓存替换的问题;在内容分发过程中将内容放置到哪些网络节点,是缓存的放置问题;如何利用网络节点中缓存的内容,是缓存内容的定位问题。这些问题对优化缓存资源分配、提高缓存命中率和减少网络重复流量有重要意义。本论文的主要研究工作和创新性成果包括以下几个方面:(1)第三章提出基于保护时间的缓存替换策略。由于业务流量的时间局部性,相同内容在一定时间内被重复请求的概率更大,如果内容请求序列的堆栈距离超过缓存容量,采用传统的最近最少使用替换策略会出现高热度内容频繁地被新到达内容替换的现象。通过对缓存内容绑定保护时间,可以避免这一现象。在保护时间内,相应的缓存内容不允许被替换,当有新内容到达缓存节点时,仅允许替换保护时间超时的内容;在保护时间内如果发生缓存命中事件,保护时间将被重置为设定值。本文基于半马尔可夫理论对替换过程进行建模分析,并推导了不同热度内容在缓存中的逗留时间和缓存状态的更新时间。理论分析和仿真实验表明,这种机制在缓存容量有限的情况下可以提高对内容热度和业务特征的感知能力,优化缓存性能。为了避免引入保护时间造成的缓存更新迟滞现象,本文又提出一种保护时间的动态调整算法,允许缓存节点根据本地缓存命中率的变化对保护时间的取值进行动态调整,使本地缓存的命中率最终能够达到最大值。(2)为了避免网络中缓存内容的同质化,提高缓存资源的利用效率,第四章对缓存的协作放置策略进行研究。首先提出了一种基于遗传算法的缓存放置策略,采用集中式控制的思想,收集所有缓存节点的状态信息和业务流量特征,并结合网络拓扑特性对缓存的放置过程进行分析,将缓存的放置过程建模为0-1整数规划问题,采用遗传算法搜索最优解,实现缓存节点之间的显式协作。接着又提出了基于跳数的路径内缓存随机放置策略,根据缓存节点与内容服务器之间的跳数距离确定缓存节点的放置概率,并基于各节点的放置概率在内容分发的路径上随机选择放置节点,通过节点之间的隐式协作,实现对缓存系统进行负载均衡的目的。本文推导了缓存命中率与内容热度分布、内容请求速率和缓存容量等参数之间的关系,并通过仿真试验证明提出的策略能提高缓存利用率,有效降低了用户获取内容所需的平均跳数。(3)研究缓存内容的定位机制。内容中心网络允许用户在发起内容请求时不关心内容来源,但网络层必须承担将请求转发到内容提供者的重要任务。为了充分利用网络中泛在的缓存资源,第五章研究缓存内容的定位问题。首先提出了一种基于蚁群算法的缓存内容定位机制,允许缓存节点发送内容探测请求并基于蚁群算法搜索到达缓存内容的最优路径;同时存储高热度内容的节点在局部范围内主动发送内容通告,以辅助完成缓存内容定位。然后提出了一种基于跟踪节点的缓存内容定位机制,以内容文件为单位建立缓存协作网络,将属于相同内容文件但分布在不同缓存节点的内容块进行资源整合,并基于跟踪节点进行协作管理。当协作网络中的节点收到请求时,可以先转发至跟踪节点,然后跟踪节点将请求快速定位到缓存所在位置。