论文部分内容阅读
随着3D显示技术和相关技术的进步,3D视频应用近来蓬勃发展。2D到3D的转换是获取3D视频的重要步骤,研究者们为了从2D视频生成3D视频提出了各种各样的单目深度线索来解决这个问题。由于巨大的需求和巨大的成本,电影制片人向3D电影投入越来越多的资金。但是,3D电影仍然不足,因此从视频中估算2D到3D转换的深度信息变得越来越重要。2D转3D是获取3D视频的重要方法之一,研究者已经提出了多种利用单目深度线索将2D视频生成3D视频的方法。首先本文介绍了人类对三维世界感知的基本原理,并讨论了基于DIBR的2D到3D转换的原理和几种立体显示技术。本文改进的算法是通过场景分类的算法从视频中估计深度信息的。本方案首先将输入的图像分为两种类型并用不同的算法处理这两种图像。对于风景型图像,本算法采用mean shift算法将不同的语义区域分割出来,以获取目标图像的深度信息;对于特写型图像,采用基于显著性检测的方法来获取目标图像的深度信息。接下来,本文搭建了一个基于FPGA的深度图估计算法平台。在FPGA开发板上,本文实现了一系列数字图像处理算法,并对这些算法进行了验证,包括颜色空间转换,中值滤波,Sobel边缘检测等。另外,本文实现了风景型图像的深度图估计算法,并通过硬件手段进行了验证。首先将SD卡中存储的图像数据读取出来,通过FIFO把数据逐个写入到SDRAM中,然后通过FIFO再读出SDRAM中的图像数据,并将本文所改进的深度图估计算法硬件化来处理读出的图像数据,最后通过VGA驱动模块显示出来以实现预定的功能。最后,深度图估计系统采用Verilog语言构建深度图提取模块,并下载到FPGA开发板上验证深度图结果。