论文部分内容阅读
图像不仅在网络传播中消耗着大量带宽,也在实际存储中占用着大量的存储空间,因此,压缩图像以便其传输和存储一直是人们研究的热点。近年来,神经网络在刷脸支付、智慧安防和自动驾驶等高层视觉领域取得了不错的效果,但在图像压缩这类低层视觉领域的效果还未达到足以成熟的压缩标准,研究神经网络在图像压缩领域的应用显得极为迫切。本文以自编码器这类神经网络为核心,研究分析了自编码器在有损图像压缩方向的压缩性能。本文首先分析了标准自编码器在端对端的有损图像压缩方面的可行性;其次,标准自编码器应用于图像压缩领域存在一些不利约束,包括仅适用于固定码率的压缩任务和无法适应任意分辨率的源图像,为解决上述缺点,本文采用了基于卷积神经网络和渐进传输思想的残差自编码器网络结构来修正标准自编码器的自身缺陷;最后,在同一测试集与合理压缩比率等条件下,将本文设计的码率可调的自编码器有损图像压缩网络与JPEG 2000图像压缩算法进行对比,实验结果表明本文的图像压缩网络在MS-SSIM(Multi-scale Structural Similarity)、PSNR、图像解码细节和算法通用性等方面都有一定的提升。本文设计的自编码器图像压缩网络是以卷积神经网络为核心,其运算过程包含不断重复的乘加法、移位和数据存取等操作,鉴于上述情况和FPGA在运算速度和功耗方面得天独厚的条件,进一步设计了自编码器压缩网络的硬件模块。首先,提取了网络的权重和偏置参数,并将浮点参数转定点参数以便于FPGA运算;其次,设计算法的硬件架构,其包含数据传输、数据存取、数据处理等模块,并使用Modelsim仿真软件对各模块进行了功能仿真;最后,在Altera DE2-115开发平台上进行了板级验证,其结果与功能仿真结果保持一致。