基于CRF的图像语义理解算法研究

来源 :天津理工大学 | 被引量 : 3次 | 上传用户:xiaoyueban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义理解是计算机视觉领域中重要的研究方向之一,其研究成果可应用于机器人导航,无人驾驶,虚拟现实,图像检索等众多领域,具有重要的实用价值和学术研究意义。图像语义分割是图像语义理解的任务之一,结合图像像素分类,从整体上理解图像包含的目标,并给出具体的目标区域轮廓。目前主流的方法一般首先提取图像中的特征,并对图像像素进行分类,然后利用概率图模型来提高像素分类,即图像理解的精度。上述方法需要解决两个问题:(1)如何提取高效的特征,进而提高像素分类的精度;(2)像素初步分类的结果如何结合概率图模型,利用图模型的约束关系来减少误分类,提高最终图像理解结果的精度。针对上述两个方面的问题,本文提出了利用多尺度深度学习进行图像理解,以及深度学习和条件随机场模型结合进行图像语义理解的方法。具体工作如下:(1)针对提取高效特征,并进行图像像素分类的问题,本文提出一种多尺度深度学习图像语义理解方法。该方法利用多尺度卷积神经网络交叉迭代来获取图像的稠密性特征,对图像的尺度变化具有较好的鲁棒性。同时,将深度学习与超像素分割相结合,修正超像素块内的像素类别,进一步提高像素分类的准确率。相关对比实验证明了方法的有效性。(2)将条件随机场模型的平滑约束引入到深度学习框架中,提出了平滑约束下的卷积神经网络损失函数。该函数可将像素分类结果的平滑约束融入到卷积神经网络的迭代过程,提高深度学习的速度和效率。实验结果表明加入条件随机场平滑约束后的图像理解精度有了较大程度的提升。
其他文献
近几年,随着变频电动机在工业领域的广泛应用,如何能够及时检测变频机的工作状态,发现可能出现的故障,并在第一时间解决问题,就显得尤为重要。论文通过对变频电动机工作原理及其早期故障发生机理的分析,根据故障检测要求,设计了基于DSP的变频机故障检测的总体方案,完成了信号采集、放大、A/D转换、锁相倍频等数据采集电路和SRAM及FLASH存储器扩展、UART异步通信、液晶显示、微型打印机输出、工作状态指示
伴随着各类数字终端的出现,同一电子图像在不同规格屏幕上显示的情况会更多的出现,这就要用到图像缩放。图像缩放是一种图像处理技术,它可以依据图像显示设备的屏幕尺寸,适当
近年来,由于终端用户资源的丰富,以及网络带宽的快速增加,传统的C/S(Client/Server)架构的网络应用模式中服务器性能瓶颈和单点失效的问题限制了资源的应用,同时也无法满足新的分布
近几十年来,人脸识别技术已发展成为模式识别领域的一个研究热点,其在身份鉴别、档案管理、信用卡验证、人机交互等方面有着广泛的应用前景。人脸识别技术中一个关键难点在于如
随着互联网的高速发展与公众的自我表现意识提高,微博等自媒体平台应运而生。公众普遍喜欢通过微博等平台获取资讯、发现新鲜事,并发布评论来表达自己的观点。微博评论文本具
在高中思想政治课教学中渗透中华优秀传统文化的元素,并采用恰当的教学策略帮助学生明晰、认同、理解、掌握和内化中华优秀传统文化的内涵,有利于中华优秀文化的DNA植入学生
随着网络技术的发展,视频传输等流媒体技术得到了很大的发展,流媒体不同于其他数据类型的传送,要求高的带宽、低的时延和包丢失率。多网卡绑定(作为一种低廉的技术)可以提高