基于视觉感知与统计的图像质量评价方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shengjie139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,随着互联网技术以及通信技术的快速发展,数字图像已经成为人们日常生活中信息传递的重要方式。据统计,2011年以来,世界产生的数字照片总量达到上百亿张,而且这个数量还在逐年增长。然而,图像在采集、存储、压缩和传输等过程中容易受到不同种类的失真干扰,从而造成图像质量的降低。所以,如何准确、可靠地评价图像的质量成为当前及未来研究中一个重要的研究热点。通常,大多数图像是由人来观看,所以最可靠的图像质量评价方式是主观质量评价,即组织观看人员根据他们的经验来对图像的质量进行主观评分,然而,随着图像数量的增多,主观质量评价的实施变得困难,而且也无法应用于实时的图像处理系统中。所以,研究者们提出客观质量评价方法,通过设计客观算法来对图像的质量做出评价。根据是否参考原始图像,现有的客观质量评价方法被分为三个类别,分别是全参考,部分参考和无参考质量评价方法。尽管目前针对这三类客观图像质量评价分别提出了大量的方法,但是客观质量评价的研究仍然不够成熟,主要表现在以下几个方面,第一,由于目前对人类视觉感知机制的理解不够深入,现有的基于度量信号失真的客观质量评价方法不能准确地模拟主观质量评价;第二,在无参考质量评价方法设计中,大多数方法仍然需要利用主观质量分数来训练质量评价模型;第三,在评价真实场景中的失真图像时,现有的客观算法的表现仍然不够理想。针对上述问题,本文从人类视觉感知和统计的角度出发对客观质量评价中部分参考和无参考质量评价展开深入的研究。具体的研究内容分为以下四个部分:第一,由于对人类视觉感知机制的理解不够深入,所以大多数客观质量评价方法主要通过度量信号本身的失真程度来评价图像的质量,这类方法由于没有考虑人类视觉感知机制而不能准确地评价图像的质量。通过对人类视觉感知机制的研究,基于自由能原理和稀疏表示,本文提出了一个部分参考的图像质量评价方法。在最近提出的大脑以及神经科学理论中,自由能原理指出视觉感知与理解是一个活跃的推理过程,这个过程是由大脑内部的一个生成模型来控制,通过这个生成模型,大脑可以对输入的图像进行预测,产生相应的预测图像。那么输入图像与大脑预测图像之间的差异可以反映图像的感知质量。而且,研究表明大脑在表示外界图像时与稀疏表示的方式类似。所以,结合自由能原理和稀疏表示,我们利用稀疏表示来近似大脑内部的生成模型,并建立了一个新的部分参考的图像质量评价模型。在该模型中,我们首先对原图和失真图分别进行稀疏表示,然后分别计算表示的残差,残差的信息熵用来反映图像感知质量的变化。图像的质量被定义为残差的熵之间的差异。实验结果表明,我们提出的方法比同类的方法预测准确性更高,同时我们的方法的时间复杂度更低。尽管我们的方法属于部分参考的图像质量评价方法,但是我们的方法仅仅需要参考原始图像的一个数字,最大程度地降低了所需的原始图像的信息量。第二,现有的无参考质量评价方法大多数属于主观质量分数已知的评价方法,此类方法通常需要大量的训练样本图像以及对应的主观分数来训练质量预测模型,相比之下,主观质量分数未知的无参考评价方法仍然较少而且已有方法的性能仍然不能与主观质量分数已知的方法相比,因此,本文提出了一个高效的主观质量分数未知的无参考评价方法,在提出的方法中,我们通过度量图像的结构、自然性以及感知质量的变化来预测图像质量的失真程度。首先,我们对图像的相位一致性和梯度进行建模,提取模型参数来表示图像的梯度信息,其次,我们对图像的局部归一化系数以及相邻系数对的乘积进行建模,提取模型参数来描述图像的自然性的程度;最后,基于大脑的自由能原理,我们对输入图像和大脑对它的预测图像之间的残差进行建模,模型参数用于表示图像的感知质量。在特征提取完之后,我们利用一组无失真图像学习出一个多元的高斯模型并利用该模型来预测图像的质量。失真图像的质量被定义为它的多元高斯模型与学习到的无失真高斯模型之间的距离。实验结果表明,提出的方法相比于主观质量分数未知的无参考评价方法取得了更高的预测准确性,以及与主观质量分数已知的无参考评价方法相当的预测性能。第三,图像在获取的过程中,由于相机参数的设置不合理,或者获取方式的随意性,获取的图像很可能受到不同种类的失真干扰,比如噪声、模糊、对比度失真等。在这些失真类型中,失焦模糊占据了很大比例,然而,专门针对这种失焦模糊的图像质量评价方法还较少,所以,在本文中,我们对失焦模糊图像的质量评价进行专门研究,提出了一个针对真实失焦模糊图像的无参考质量评价模型。首先我们通过主观实验建立了一个专门的失焦模糊图像数据库,然后提出了一种专门针对失焦模糊的图像质量评价方法。在该方法中,我们利用梯度和相位一致性特征来提取图像的结构信息,从而度量图像的模糊程度,其次,考虑到失焦模糊的在图像中的随意性,我们对图像进行显著性检测,利用显著图来加权图像的模糊程度图,最后对加权的模糊程度图进行池化,得到最后的质量分数。实验结果表明,我们的方法与主观质量评价的结果具有较高的一致性。第四,现有的图像质量评价方法尽管在现有的数据库上取得了较高的预测准确性,但是这些数据库的失真大多数都是人为生成的失真,与真实获取到的图像具有的失真存在较大的差异。真实图像中的失真具有很高的复杂度,准确地预测其质量仍然具有很大的难度。针对如何准确地评价真实失真图像的质量,本文提出了一个无参考的基于神经网络的真实失真图像的质量估计模型。在提出的方法中,我们提取了与质量相关的两类统计特征,第一类特征是提取图像局部归一化系数的统计分布来描述视觉感知的低层次特性,第二类特征是提取图像与大脑预测图像的预测残差的统计分布来描述视觉感知的高层次特性。然后我们设计了一个四层的神经网络对图像的质量做出预测。实验结果表明,我们的方法相比于现有的无参考质量评价方法取得了更高的预测准确性。
其他文献
富含凝析油的缝洞型碳酸盐岩凝析气藏在当前油气资源储量中占有相当比例,了解这类油气藏在开采过程中的变化规律是世界各国油气公司最关心的重大问题之一。鉴于缝洞型储层中
海洋无脊椎动物是海洋药物的重要来源。而共附生于这些动物体内的微生物与宿主产生密切的联系。有研究表明海洋无脊椎动物共附生微生物可能是海洋无脊椎动物次生代谢产物的真
日本乙型脑炎病毒(Japanese encephalitis virus,JEV)是黄病毒属的一种蚊媒病毒,是急性病毒性脑炎和流行性脑炎的常见病因。世界上大约60%的人口居住在JEV流行地区。由于全球变暖,病毒继续传播到以前未受影响的地区。JEV感染机体后大部分的病毒能被机体的免疫系统清除,但有少量病毒能够逃逸机体的免疫反应并穿越血脑屏障(blood-brain barrier,BBB)进入到中枢
本文针对凉山南红玛瑙、保山南红玛瑙、巴西玛瑙、马达加斯加玛瑙、北红玛瑙、宣化战国红玛瑙、大同玛瑙七个品种玛瑙进行实验,将各个品种分类进行热处理,并利用宝石显微镜、扫描电镜、红外光谱、拉曼光谱、光纤光谱、差热分析等现代测试技术,对各品种玛瑙加热前后的各项性质变化进行了详细的分析研究。通过显微观察可知,玛瑙在热处理过程中发生了一系列颜色及结构上的变化。随着温度的上升,各样品均有颜色发灰的现象出现。大同
目的:近年来,全球恶性肿瘤的总体发病率呈现持续升高的趋势,死亡人数上升。恶性肿瘤等慢性非传染性疾病已成为全球的第二大死因,2010年恶性肿瘤造成的疾病负担占总疾病负担的
2001年越共九大的召开在越南历史上具有特别的意义,从越共理论思维的角度来看,这一年是越共理论成果取得重大突破的一年。事物的发展不是一蹴而就的,越共九大召开前越南走过了十五年的革新历程,这十五年理论和实践的发展为越共九大取得质的飞跃提供了量的积累。越共对马克思主义的灵活运用和准确把握为越南革新实践提供了正确的行动指引。越南在经济、政治、社会建设领域的革新实践取得了明显的成效,这离不开理论思维革新的
岩黄连(Corydalis saxicolae Herba)为罂粟科植物石生黄堇(Corydalissaxicola Bunting)的全草,其生物碱提取物临床用于治疗急性黄疸型肝炎、肝硬化、肝癌、疮疖肿毒、急性肠
近些年来,我国经济快速发展,居民生活水平不断提升且越来越追求高质量的生活。居住环境在人们生活中逐渐占有重要地位,因此极大促进了我国建筑行业的发展。建筑行业关系着国
随着数码相机和智能手机的普及,以及网络和微博的快速发展,数字图像和视频已经成为日常生活中最受欢迎的一种信息表现和传递沟通的媒介。每天海量的数字媒体信息汇聚到互联网