【摘 要】
:
随着5G、物联网、云计算的发展和行业数字化进程的深入,互联网流量爆炸式增长,网络应用也日趋复杂化和多样化,要求网络设备不仅具备极高的处理性能,还应具有极好的灵活性,能够提供面向新型协议、业务的快速定制及优化能力。然而,网络处理器作为网络设备的核心处理单元,采用通用多核或者专用多核的实现方式,难以同时兼备极高的处理性能和良好的灵活性。基于通用多核实现的网络处理器虽然具有极好的灵活性,但存在报文处理吞
论文部分内容阅读
随着5G、物联网、云计算的发展和行业数字化进程的深入,互联网流量爆炸式增长,网络应用也日趋复杂化和多样化,要求网络设备不仅具备极高的处理性能,还应具有极好的灵活性,能够提供面向新型协议、业务的快速定制及优化能力。然而,网络处理器作为网络设备的核心处理单元,采用通用多核或者专用多核的实现方式,难以同时兼备极高的处理性能和良好的灵活性。基于通用多核实现的网络处理器虽然具有极好的灵活性,但存在报文处理吞吐率低、处理延时高等不足。基于专用多核实现的网络处理器通过扩展定制指令提升报文处理性能,但扩展新协议、新处理动作需要重新定制专用指令,灵活性受到限制。FPGA具有良好的可重构性和处理性能,适合用于加速网络功能中并行度高的定制处理逻辑。目前,FPGA已经广泛用于数据中心、5G等网络应用场景。相对于FPGA而言,ASIC虽然灵活性差,但具有更高处理性能,适合用于实现网络功能中的通用处理逻辑。因此,本文提出了集成ASIC、FPGA、CPU三种处理资源的可重构通用多核网络处理器模型,能够匹配各种类型的报文处理动作,以克服传统网络处理器在处理性能和灵活性上的缺陷。本文对可重构网络处理器模型设计中的关键技术展开深入研究,主要工作和创新点包括:1.提出一种ASIC-FPGA-CPU协同的可重构网络处理器架构PicoArch。PicoArch针对报文处理特点将数据平面拆分为快速转发、功能加速和深度处理三个子平面,并分别由一种处理资源承载。快速转发子平面基于ASIC实现,采用协议无关的“匹配—动作”抽象,能够实现分类、转发、调度等各类无状态报文处理功能,具有高吞吐和低延迟的特点。功能加速子平面基于FPGA实现,利用FPGA可重构特性,负责加速新业务、新协议等专用报文处理,兼备良好的处理性能和灵活性。深度处理子平面基于通用多核实现,集成有大容量的存储资源,能够实现应用层协议识别、深度报文检测等有状态报文处理功能,具有极高的灵活性。2.为解决在ASIC上部署新协议需要重新定制报文解析器的缺陷,提出了一种协议无关的可编程解析器P5。利用网络协议分层解析的特点,P5将协议解析抽象为协议无关的“匹配—提取”操作。其中,“匹配”操作负责解析协议的类型,“提取”操作则根据解析的协议类型从报文头部提取字段。通过配置“匹配—提取”规则表,开发者可以自定义解析的协议类型和需要提取的字段。此外,P5利用报文间协议解析的独立性,开发单解析器多报文并行解析技术,能够最大限度地提升报文解析的性能。P5还应用了多种优化技术,包括协议匹配算法,协议预解析,分别用于降低硬件资源开销和提升解析性能。3.为简化基于FPGA开发网络功能的难度,提出了一种面向FPGA的快速可重构分组处理技术DrawerPipe。首先,DrawerPipe采用模块化设计框架,将报文处理流水线抽象为一系列具有相同接口的“抽屉”。Drawerpipe允许开发者在“抽屉”中装载已开发的硬件模块,并组合这些“抽屉”以重构所需的网络功能。其次,利用常见网络功能报文处理流程的相似性,DrawerPipe提供通用的五个基本模块,以避免相同功能的冗余开发,并降低网络功能开发难度。最后,我们为DrawerPipe设计了一种模块索引机制PMI,允许用户自定义DrawerPipe模块处理报文的先后顺序,从而构建所需的网络功能服务链。4.为测试PicoArch的处理性能和灵活性,我们利用Xilinx FPGA和多核CPU实现了基于PicoArch模型的原型系统——NP40S,并由FPGA代理ASIC实现协议无关流水线PicoPipe的功能。此外,我们为NP40S提供完备的网络功能开发服务——NPAS,不仅提供网络功能设计、开发、调试工具和丰富的编程接口,有效降低网络功能开发难度;同时还集成有软件NP仿真器,支持芯片级功能仿真和性能评估。本文基于NP40S实现了简化的L3路由功能(无状态分组处理),以及集成有多种有状态分组处理的统一安全网关,并仿真测试其处理性能和资源开销。实验结果表明,PicoArch具有极好的处理性能和灵活性,能够满足各类网络功能对吞吐率、处理延时和可编程性的需求。
其他文献
城市计算是计算机科学以城市为背景,跟城市规划、交通、能源、环境、经济和社会学融合的新兴交叉领域。城市计算的任务,是首先通过感知、获取城市中产生的各类大数据,然后采用高效的数据管理技术、先进的算法以及新颖的可视化技术来分析处理及展示大数据,用以解决城市中存在的诸多问题和挑战,如交通拥堵、空气污染、规划落后等。城市内产生的大数据多种多样,如人或车移动时产生的轨迹数据、各大媒体平台发布的新闻、股市里时刻
随着大数据时代的到来,网络空间的数据资源越来越丰富,其数据量已经远远超出了传统数据分析技术和信息系统的处理能力,寻求海量数据中的有效的信息已成为各领域的迫切需求。知识图谱以其语义网的本质,将客观世界存在的实体、关系、属性等概念以结构化知识的形式连接成庞大的网络,作为人类描述知识的重要载体,为大数据环境下的信息获取提供了便捷快速的解决方法。其中,人物实体作为信息交互的枢纽,往往在寻找目标知识的过程中
当今社会,无线通信为人们打开了俯瞰世界的视野,并逐步成为人们生活中密不可分的一部分。然而,随着社会的不断进步,无线通信的发展面临着诸多挑战。一方面,新兴概念如虚拟现实(virtual reality,VR)、物联网(Internet of things,Iot)、智能制造等的出现对无线通信的吞吐率、延迟、可靠性等方面均提出了新的更高要求。而另一方面,适合无线通信的频谱资源又非常有限。因此,增强对现
面对不断提高的卫星成像分辨率以及快速增加的在轨卫星,天基对地观测卫星系统获取数据的速度和总量都呈爆炸式增长。据报道,我国在轨卫星每天获取的对地观测数据高达数百个TB,而且增长势头强劲,这意味着对地观测大数据时代已经来临。当前,用户对卫星对地观测数据服务提出新要求。在时间分辨率上,用户急需卫星对地观测数据在获取、传输、处理和分发整个流程中的响应趋向近实时化;在空间分辨率上,用户需要卫星图像的分辨率高
在大规模分布式智能视频监控中,终端摄像头连续不断地向远程服务器发送所采集的视频数据,不仅需要较大的网络带宽和存储空间,而且网络传输延迟较大,面临采样视频压缩的严峻挑战。压缩感知能从基于少量采样点获取的测量值中重构原始数字信号,并在采样过程中完成数据压缩,非常适合于在智能监控终端完成高压缩率的监控视频采集。然而,目前的大部分压缩感知方法采用单一测量率进行压缩感知采样和重构,导致重构质量和采样压缩率的
软件是互联网生态重要组成部分,然而由于设计不当、开发失误等原因,软件中存在形式多样的漏洞,对软件安全乃至互联网安全带来严重安全隐患,不仅威胁个人隐私与财产安全,也对国家战略安全造成重大威胁。通过自动化手段挖掘软件漏洞,发现系统安全隐患并及时防护,是保证系统安全、稳定运行的必要手段。因此,软件漏洞自动化挖掘技术研究具有极高学术价值与现实意义。模糊测试是一种应用广泛的软件漏洞自动化挖掘技术。自其提出以
随着片上系统规模的不断扩大和处理核数的增多,系统对于片上Cache在容量和速度方面有了更高的要求。为了能够有效利用Cache资源,通常采用非一致Cache访问(NUCA)结构以支持高容量低延迟的Cache组织。另一方面,片上网络由于具备良好的可扩展性在片上众核处理器的互连方式上具有显著优势。因此,基于片上网络的非一致Cache访问体系结构逐渐成为未来众核处理器用于组织大容量Cache的主流系统架构
同时定位与建图(SLAM)是计算机视觉领域的重要问题,在无人驾驶、自主导航、成像制导、侦察等领域有着广泛应用。红外相机可以在夜间、雾霾、光照差的环境下成像,具有全天工作能力,因此红外SLAM比可见光SLAM的潜在应用场景更广。但是由于红外数据获取困难、图像纹理弱、信噪比低,国内外对红外SLAM的研究十分有限。本文以适用于红外成像的SLAM系统为研究目标,在研究过程中主要解决了红外相机标定、SLAM
云计算平台是支撑互联网应用服务和大数据处理不可替代的基础设施,已经广泛应用于人类的生产、生活和城市治理的方方面面,呈现出大量数据密集型应用和日益提高的多应用粘合度,这不断加剧了云计算平台的I/O压力。为了支持应用迁移,提高云服务可靠性,云计算平台中的虚拟机使用分布共享存储资源来存储其关键数据。共享存储通过内部网络(如以太网)互连,大数据量存取的带宽可超过单磁盘带宽,但是,在小量数据存取时,延迟大,
基于计算机视觉的自动图像分割是机器辅助医疗图像分析任务中至关重要的步骤。自动且快速地获取具有准确分割掩码的医疗图像,对于帮助医生提高诊断精度、速度以及针对不同病人提供个性化的治疗方案具有重要的意义,针对该技术的研究也是当前科研领域的热点方向。在所有的研究问题当中,由于受到医疗图像独有的对比度低、噪声大、伪影多、内存占用量大以及获取标注信息困难等特性的影响,表示学习成为了提高医疗图像分割性能的核心方