论文部分内容阅读
近年来,随着图像等非结构数据的海量产生和使用,现有冯诺依曼计算架构面临着严峻挑战。由于该架构存在速度和内存瓶颈,在类似图像处理和深度学习等频繁调用去噪、增强或信息提取的应用中,会给系统带来极大的硬件负担。尤其在数据密集的情况下,计算单元与内存通信的压力常常限制了电路或芯片的计算能力,同时低下的面积、功耗效率也带来昂贵的开销。因此,我们迫切需要一种全新的计算方式来提升图像处理算法的执行效力。CIM(Computation-in-Memory,在内存中计算)正是这样一种非冯计算体系。借助存储与计算融合的理念,数据将可以在同一物理位置被记忆与处理,这缓解/消除了数据流通带来的内存带宽压力。同时,由于CIM更近似于人脑工作方式的特点,其具有结构简单,应用灵活多变的优势,可以针对不同的图像算法开发专用处理电路。此外,借助多值忆阻器的信息密度和物理尺寸优势,整个电路的集成度将显著增加。本文深入研究了忆阻器,CIM架构和图像处理算法,探索三者之间有机的结合方案。首先,讨论了基于多值自旋忆阻交叉阵列的核心CIM加法器。进一步,基于所提出的CIM方案开展外围电路设计,分别研究针对图像掩膜和双线性插值算法的电路和控制方案。最后,分析电路对多值存储单元分辨率以及不同功能模块的兼容性。具体的,本文将主要内容分为如下四个部分:(1)首先,本文分类总结了目前常见的忆阻器类型,介绍其物理机制和主要特点,重点介绍了自旋忆阻器的工作特性以及适用于本文的原因。接着,基于自旋忆阻器的物理参数,对该忆阻器的阻变机制进行了细致全面的推导和数值分析。最后,通过数值和电路仿真对忆阻器进行了模拟,直观的展示出忆阻器作为多值存储单元获得外部激励时的特性变化。(2)进一步,本文基于自旋忆阻器交叉阵列提出了一个自更新的多值忆阻掩膜电路,其中包含了一种新型多值模拟加法器,该加法器可以作为读取器输出阵列中的数据,也可以同时对多个多值数据进行加权求和。进一步,我们设计了一套外围电路及控制时序使该CIM方案支持图像掩膜操作。该电路实现了一定程度上的自治,使之工作时几乎不必依赖上级计算单元。最后,我们用一系列的计算机仿真验证了所提方案在图像去噪和边缘提取中的有效性。(3)下一步,本文重构了上文的多值模拟加法器,在原有忆阻交叉阵列上进行结构创新,设计了一个忆阻双线性插值电路。在此电路中,提出了基于位置的权重映射模块,其以电压的形式为忆阻双线性插值电路自动生成权值参数。该电路在继承上文忆阻掩膜电路的同时以模拟计算的形式提供可观的性能优势。最后,我们通过实现图像缩放和对比度有限自适应直方图均衡(CLAHE)算法来验证设计的有效性和可扩展性。(4)最后,本文讨论了所提出的一系列专用图像处理电路的兼容性,包括电路对不同功能的兼容以及对存储单元的兼容。特别的,我们以去噪和边缘提取为例,对不同位数的多值忆阻存储单元进行讨论,分析了在不同程度降低器件条件的情况下,也即像素分辨降低的情况下电路的有效性。