SSD控制器中的PCIe_DMA的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zmn100200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球经济的发展,信息技术得到了广泛使用。云计算、虚拟服务器和AI等行业的兴起,对存储器的性能要求越来越高。传统的机械硬盘已不能满足这些高性能需求。固态硬盘凭借体积小、功耗低、噪音低、速度快、抗震性好等优点,在多个领域得到了广泛应用,因此分析它的结构并提高性能十分重要。SSD的关键组件是控制器和存储介质,高性能的SSD其内部有独立的ARM核实现FTL算法。从固态硬盘的结构出发,要提高性能可以从以下几个方面考虑:选择性能更好的存储介质、优化控制器的设计、采用链接速度更高的软件接口标准。如今,存储器的性能瓶颈已经从底层存储介质部分上升到了顶层的控制器性能部分。因此本文从优化控制器这一角度出发来提升SSD的性能。本设计选用PCIe作为主机与SSD交互的接口,Nand闪存作为主要存储单元,同时遵循NVMe软件协议。在PCIe接口SSD控制器基础上,为提高Host访问固态硬盘的效率,通过增加负责轮询检测CPU的128个线程,以轮询的方式取走每个线程配置的命令,且每个线程均可配置16个Flash通道命令的线程轮询模块和负责对Host返回报文进行排序处理的乱序处理模块,以及软硬件协商的访问命令字段定义,实现了Host侧的多线程对多通道Flash并行访问的功能。主机端CPU的128个线程可以对16个Flash存储通道进行访问,且线程与通道之间没有绑定关系,使得CPU侧能够均衡负载,延长整个固态硬盘的使用寿命。配合主机端对闪存访问命令的打散处理,多个Flash通道可以并行工作,减少读写访问需要的时间。设计中的PCIe_DMA发送引擎与接收引擎无耦合关系,可以充分发挥PCIe链路的全双工性能,提高带宽利用率。同时将DDR4 SDRAM缓存映射至PCIe BAR2空间,支持被动接收响应外部DMA引擎发送的数据传输请求,可应用于其他PCIe设备对SSD的端对端访问。本文在提出上述改善SSD控制器性能方案的基础上,确定了在Altera arria10系列FPGA板上实现控制器逻辑。首先用可综合的Verilog语言实现PCIe_DMA中每个子模块的设计,然后提取设计模块的验证功能点并制定验证策略,接着使用System Verilog语言搭建基于UVM的验证平台,并对验证平台中的激励产生方式进行了重点说明,然后对PCIe_DMA模块和整个SSD控制器子系统进行功能验证,通过查看仿真报告和波形分析发现设计能很好的实现逻辑功能;最后通过FPGA上板验证,可知设计的功能正确。多次测试之后粗略计算出Host访问SSD的速率,可以看出多线程提高了Flash通道工作的并行性,减少了访问延迟。由此可知本文设计的PCIe_DMA模块在提升整个SSD性能方面发挥了重要作用。
其他文献
随着深度学习的发展,大规模的遥感影像和自然影像数据集让图像分割算法在更多领域得到应用,但是样本的多样性也给分割算法带来了一定的挑战,其中如何解决跨尺度特征融合以及多尺度目标分割一直都是学术研究的热点。考虑到现有基于深度学习的图像分割算法存在的问题,本文针对目标分割的难点,从特征提取网络、高分辨图像恢复、几何特征学习等方面提出了改进方法。主要研究内容如下:1、提出一种基于自适应提升小波融合网络的多尺
聚类算法是指根据数据的关联性,将相似数据划分至相同数据簇,而将相异数据划分至不同数据簇的过程。随着计算机深入到人们日常生活中,互联网上每天都会产出海量的数据,但这些数据大多数是不包含标签的。给这些海量数据做人工标注非常耗时费力,所以目前较为成熟的有监督学习算法面临着训练数据匮乏的问题。因此使用无监督学习中的聚类算法,根据样本之间的相似性对其自动分组具有非常重要的研究意义。传统的聚类算法只能提取数据
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)作为一种多载波调制技术,凭借高频谱效率与抗多径干扰能力等特点,在线性时不变信道中的性能优异。然而,OFDM在高多普勒扩展的时变信道(如高速铁路移动通信)中的性能会急速下降。正交时频空(Orthogonal Time-Frequency Space,OTFS)在高多普勒扩展信道中,其每个发送
自然语言理解的研究是目前人工智能领域的热点之一,以此为核心的技术突破与相关模型的落地实现也层出不穷。目前,深度学习在工业产品订制中的应用尚未推广开,随着智能制造的兴起与互联网技术的进步,未来借助自然语言理解实现用户产品个性化推荐必将迎来更大的市场空间。为用户提供更好的个性化推荐,关键是要准确了解用户的偏好特征。计算机在理解用户偏好时首先要解决的是自然语言理解中出现的歧义问题。本文通过分析国内外自然
近年来,煤矿托管运营模式逐渐发展成为一种新型煤矿生产组织模式,其特点是把煤矿企业的所有权与经营权剥离,将中小型煤矿委托给生产经验丰富、管理团队专业、技术水平高、社会资源充足的专业化运营公司,解决了煤矿企业传统经营模式下人员素质低、技术力量薄弱及安全风险管控不足的问题。随着国家对托管运营模式的推广应用,出现了一系列风险管理问题,例如委托方与被委托方财务管理纠纷不断、安全事故频发等,反映出煤矿企业对托
认知雷达作为雷达未来发展的方向之一,其最大的特点是构成了从雷达接收端到发射端的闭环信号处理系统,该系统通过实时感知环境和目标信息,基于先验信息和推理调整雷达发射和接收参数,使雷达能在各种环境中处于最优的状态。MIMO雷达由于在发射端具有极高的设计自由度,可以作为实现认知发射的载体,能在阵列结构固定和发射资源有限的前提下,根据不同的任务场景灵活设计发射端各天线的发射信号。在此背景下,本文主要研究基于
弹道导弹和高速飞行器的快速发展,使得高速目标的检测成为雷达的重要任务之一。由于宽带雷达的距离分辨率更高,可以获取的目标特征信息更多,在运动参数估计和目标识别等方面有着更多的优势。因此,研究基于宽带雷达的高速运动目标检测具有重要的应用价值以及明朗的应用前景。为了提高雷达对高速目标的探测和分辨能力,通常要求雷达的发射信号具有大的时宽带宽积,从而导致需要处理的回波数据量增多和现有检测算法的计算复杂度增大
IGBT是电力电子设备和电力系统主电路中常用的功率开关器件,将多个功率半导体芯片按照一定拓扑进行串并联之后封装为一体形成功率半导体模块,当模块中主要的功率芯片为IGBT管芯时,该模块被称为IGBT模块。当IGBT模块电流等级较大时,往往需要多个管芯并联,多管芯并联的IGBT模块的性能主要体现在两个方面,电性能和热性能。其中电性能主要表现在模块内部各并联管芯之间电流分布是否均匀,同时,模块关断时在I
在无线通信技术的快速发展中,网络业务量急速增长。尤其是第五代移动通信系统(5th Generation Mobile Communication System,5G)商用以来,单一的无线接入技术(Radio Access Technology,RAT)难以应对用户日益复杂多变的业务需求,形成了包括5G和第四代移动通信系统(4th Generation Mobile Communication Sy
近年来,在计算机视觉领域,视觉目标跟踪技术日益成为研究热点。基于相关滤波的目标跟踪算法在满足跟踪实时性要求的同时,跟踪性能也表现优异,因而在视觉目标跟踪领域受到了广泛关注。然而,此类算法在复杂多变的跟踪场景下,仍面临诸多挑战。本文针对复杂场景中的挑战因素,在相关滤波跟踪框架的基础上提出了两种改进算法,有效提高了算法在背景混乱、大范围形变、遮挡和旋转等复杂场景下的鲁棒性。本文的研究成果和主要贡献如下