论文部分内容阅读
随着无线网络的高速发展和手持设备(智能手机和平板电脑等)的迅速普及,用户对多媒体业务的需求呈爆炸性增长。由于用户设备的多样性,源视频必须被转码为不同的版本,但视频转码却是一个计算昂贵且耗时的过程。由于无线网络的动态特性及计算资源的稀缺性,为用户提供满足时延要求的视频转码业务是一项巨大的挑战。鉴于此,本文针对点播视频转码和直播视频转码两种不同的业务展开了研究,具体内容如下:1)针对点播视频转码业务,本论文提出一种基于移动边缘计算的异构网络框架,通过将终端设备的视频卸载到移动边缘计算服务器上进行转码,能有效地减轻终端的计算负担。与现有的文献不同,由于运营商是以盈利为目的的,本文联合卸载决策和计算资源分配以最大化卸载的视频数量来提高移动运营商的收益,并且降低时间延迟。另外,边缘计算服务器为每个用户开辟了一个缓冲队列,用于存储在一个时隙内还没有被转码的视频。在效用函数中,这个队列长度被定义为惩罚项以避免严重的时间延迟。本文采用一种基于actor-critic加强学习的资源分配算法来解决此优化问题。仿真结果表明,本文提及的算法能获取最佳策略使被转码视频的数量最大化,并能降低时延。2)针对直播视频转码业务,本论文提出一种基于软件定义的边缘云辅助异构网络架构来实现直播视频的转码和传输,该方案不仅可以显著降低核心网的通信压力,还可以大幅度减少时间延迟。通过联合用户调度、转码策略选择、计算资源和无线频谱资源分配以最大化视频质量,同时满足直播视频业务的时间延迟要求。与现有文献不同,为了接近真实的无线环境,我们在研究中将可用的计算资源和无线频谱资源建模为随机过程。考虑到无线网络的动态特性和可用资源的有限性,我们将问题建模为马尔可夫决策过程(Markov Decision Process,MDP)。由于此MDP的动作空间是连续与离散动作混合的动作集合,传统的学习算法不能找到最优策略。因此,本文提出了一种增强的Actor-Critic(AC)算法来解决该问题,其中Actor部分和Critic部分均引入资格迹来加速学习过程。仿真结果表明,与策略梯度(Policy Gradient,PG)算法和深度Q学习网络(Deep Q-Network,DQN)相比,该算法具有更好的性能。