论文部分内容阅读
构建于边缘计算之上的跨域大数据分析应用能够获得更广阔的计算域、更丰富的资源储备,以及更灵活的服务模式。然而,低时延——这一跨域大数据分析优化领域积极追求的重要指标——却在多边缘计算环境中面临挑战,如边缘网络的带宽约束与其所承载的原始数据上传需求间的矛盾;边缘资源不稳定的性能与多阶段并发执行作业的低时延需求间的矛盾。本文聚焦于上述问题开展研究,基于多边缘协同调度,在一定程度上保障了多边缘系统中跨域大数据分析作业的完成时延。由于边缘存储空间受限,不似数据中心可提前缓存大量原始数据,系统是待计算作业发布后才着手安排原始数据自终端向边缘集群的上传。每个作业又可能同时在多个边缘有着数据上传和处理的需求。考虑边缘网络的带宽约束和计算力限制,多作业易于多边缘发生竞争,而无序竞争会造成整体性能下滑。本文提出多边缘资源调度算法Smart Dis,为跨边缘执行作业的并发任务协调数据上传和处理顺序,优化作业级别的执行时延。Smart Dis基于这样的观察和考虑:由于数据量和边缘服务能力的差异,作业于各边缘的任务时延存在偏斜,因而对于作业在某一边缘超前的子任务,可以适当延迟调度,因为作业的完成取决于最滞后子任务的完成。理论上可证明Smart Dis能够保障整体的数据上传耗时不超过最优值的3倍。模拟实验表明Smart Dis优于现阶段任一跨域作业调度算法,能够实现至少25%的性能提升。在Smart Dis调度的基础上,本文进一步发现,边缘资源的性能不稳定易造成并发处理作业陷入“慢”任务沼泽,出现执行时延长尾。已有研究表明多副本执行,即任务复制,可较好地控制“慢”任务延迟,加速作业。同时,对于资源受限的边缘,人们可能希望不仅在本地复制,还可以于其它空闲边缘中执行副本。但是,已有复制算法皆针对单集群设计,并不适用于高动态高异构的多边缘计算系统。本文引入随机变量细粒度刻画各异构边缘中资源性能的不稳定性,并设计在线任务跨域复制算法Geo Clone,其适应各边缘的可用资源状态与系统总体负荷状况,协调多作业的任务复制需求。本文基于理论分析严格证明Geo Clone具有高效竞争比。同时,本文通过开展原型和模拟实验,全面评估了Geo Clone在实际执行中的优势。