图像的稀疏表示及编码模型研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zh0518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像压缩技术是存储和传输数字图像的关键技术。现有的压缩技术以像素矩阵为编码对象,通过预测、变换、量化和熵编码去除图像中的冗余信息,而达到压缩图像的效果。经过多年以来的研究和发展,目前正在应用的压缩技术在性能上提升的空间已经不大,而系统的复杂程度却显著增加。同时,目前的技术采用基于块的编码思想,以及用像素差异控制率失真优化,在低码率下重构图像的视觉效果不高。本文从人脑知觉模型的角度,对编码对象的改进做了广泛而深入的研究。首先,本文在广泛搜集了脑科学、神经学和心理学等学科的相关研究成果基础上,阐述了面向编码的人脑模型。其中着重指出了可以用于指导改进编码效率与视觉质量评估的视觉特性。在给出视觉系统物理模型的基础上,对神经元的有效编码理论作了全面的概括与分析,包括二阶线性模型,高阶线性模型以及高阶非线性模型等。随后,指出在各种线性和非线性模型中,具有较大实际意义的是高阶线性模型,即稀疏编码模型。稀疏编码模型中最重要的部分是如何获取用于编码图像的基函数字典。本文首先使用基于学习的方法,在高斯白化之后的训练图集上得到了超完备基函数集合的子集。该函数集合具有人眼视觉系统所具备的局部性和带通特性,其响应概率分布也满足稀疏分布,可以作为用于编码图像的基函数。但是基于训练的方法得到的基函数集合存在收敛不稳定以及泛化能力不高的问题。为克服学习得到的基函数集合所存在的问题,本文引入调和分析中的多尺度多分辨率分解曲波变换。曲波变换在数学上拥有对二维曲线奇异的理想的逼近阶,同时对分解得到的各个子带中不同朝向的基函数的系数满足稀疏性的特点,仅使用少量有代表性的系数就可以重构出图像的主要结构。实验表明,使用10%的大系数对图像进行重构时,可以满足视觉的需要,而当使用的系数达到50%时,人眼观察无显著失真。该方法可以作为前端图像表示部分,用以构建基于视觉的图像编解码器,具有很强的理论和实际意义。
其他文献
随着计算机技术的飞速发展,计算机系统已经被广泛的应用于航空航天、医疗卫生、金融等高可信性领域,并且发挥着极为重要作用。这些领域的应用对计算机系统的可信性提出了较高
21世纪是知识经济的时代。随着因特网相关技术的飞速发展以及知识的爆炸式增长,企事业组织为了能够在未来的知识竞争中立于不败之地,相继构建了知识管理系统,实现内部知识的
无线传感器网络是当前信息领域中的热门话题,其能够在特殊环境下实现信号的采集、处理和发送,是一种全新的信息获取和处理技术,在现实生活中得到了越来越广泛的应用。本文致
随着信息技术的飞速发展,许多企业开始重视信息化管理,多数企业建立了自己的信息系统。信息系统不但提高了企业的办公效率,而且为企业创造了价值,同时,由于信息共享的特性,信
无线传感器网络是由部署在监测区域内大量的传感器节点组成,通过无线通信方式形成的一个多跳的自组织的网络系统。由于无线传感器网络具有组网快捷、灵活且不受有线网络约束
随着科学技术的发展,生产规模越来越大,复杂性越来越高,生产车间的优化调度问题已经成为提高企业生产效率进而提高市场竞争力的核心之一。   生产调度,即对生产过程进行作业计
在嵌入式移动实时数据库系统环境中,为了支持大量移动客户端并发访问服务器上的数据,人们提出了数据广播技术。数据广播充分利用移动环境中网络带宽的非对称性,周期性的将热
边缘检测是许多计算机视觉和图像处理应用中的一个基础操作,不仅显著的减小信息量来简化图像分析,同时还保留在场景中有用的结构信息。现在有很多关于灰度图像边缘检测的研究
随着计算机应用领域的迅速扩大,软件规模及复杂性的不断提高,软件危机日益严重,提高软件的生产效率和质量成为软件产业的当务之急。近些年来面向对象技术的发展成熟和Internet网
可信计算平台是个新兴的研究方向,可信计算已经成为研究的热点。作为可信计算平台的核心,操作系统对可信的要求不言而喻。作为开源的Linux,其特点很适合用作可信计算平台的操