基于有监督分层狄里克雷过程的对象分割模型

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:fyz123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉领域研究的深入,对象类图像分割(也称对象分割)逐渐成为近年来图像分析、计算机视觉领域研究的重要问题之一,并不断推动和促进互联网搜索、智能家电、智能交通和自动驾驶汽车等相关领域的技术和产业的发展。本论文主要依据贝叶斯理论并结合随机场模型,研究基于有监督的非参数化的对象分割模型及其算法。本论文的主要内容和创新点主要有以下几个方面,1.提出了一种新的基于分层狄里克雷过程的非参数化判别模型来解决对象分割问题考虑到分层狄里克雷过程(Hierarchical Dirichlet Process,HDP)模型和隐条件随机场模型各自的特点,本论文一方面采用隐条件随机场模型(Hidden Conditional Random Field,HCRF)模型描述图像底层特征与语义对象的映射关系,并通过隐变量定义复杂的势函数,以期在实现对样本聚类的同时引入观测数据在空间上的平滑性约束。另一方面,通过引入HDP作为先验分布构造一种非参的判别模型用于描述多组结构化数据(如不同的输入图片)。这样,通过采用共享隐变量的假设,本论文将生成性的HDP模型和判别性的HCRF模型结合起来,提出一种新的判别性的非参数化随机场模型,即HDP-HCRF模型。该模型除能够实现对单幅图片中多类对象的分割外,亦可用于解决多输入图片的对象分割问题。2.提出了一套用于解决含隐变量的有监督非参数化模型的最大条件似然估计及其推理算法考虑到常用的EM (Expectation Maximization,EM)算法和对比散度(Contrastive Divergence,CD)算法都不能很好的解决含隐变量的HDP-HCRF模型在训练中的最大条件似然估计问题,因此本论文借鉴蒙特卡罗 EM (Monte Carlo Expectation Maximization,MCEM)算法推导出条件蒙特卡罗EM (Conditional MCEM,CMCEM)算法,并给出了其在线形式。由于HDP-HCRF模型结构简洁,减少了各部分的耦合性,因此便于采用迭代更新的训练方式,从而提高了算法对不同类型的具体问题的适应能力。另一方面,由于存在非参数化的HDP模型,即隐变量的状态可以有无限多取值,而与其相关的模型参数也自然的被推广到无限维,因此为减少计算量本论文将利用随机场模型的伪似然和树结构表示分别对优化目标函数作近似展开;此外,本论文在后者的目标函数中又引入关于参数的L1正则项,以减少模型的过拟合问题。3.在HDP-HCRF模型中引入高阶项,并给出其BMRM解考虑到对象分割属多分类问题,而且一幅图通常包括一类(甚至几类)对象的多个实例,为进一步描述图中同一对象的不同实例间的相关性以增加平滑隐状态的取值在空间上的平滑性。本论文又通过隐变量在HDP-HCRF中引入更高阶势函数。为避免配分函数的计算,给出了类似max-margin的最大边缘后验解及其基于正则化风险最小的束方法(Bundle Methods for Regularized Risk Minimization,BMRM)算法的训练过程及其推理。在不同数据集的实验结果同样表明,我们提出的模型和算法可用于解决对象分割问题,且性能优于常用的基于超像素的对象分割算法。
其他文献
学位
学位
杜甫,千百年来让人仰望的现实主义诗人,向世界展示的不仅是其不朽的作品,还有中华民族知识分子伟大的人格。享有"诗圣"之美誉,为历代文人士子们的学习典范,同时,其作品以其记实性与叙事性而被誉为"诗史"。"诗史"的称号最早在唐代孟启的小说《本事诗》中被提起:"杜逢禄山之难,流离陇蜀,毕陈于诗,……故当时号为‘诗史’"。宋祁在《新唐书杜甫传》中也说:"甫又善陈时事,律切精深,至千言不少
期刊
《钱注杜诗》是明清之际的著名文学家钱谦益所著,该著作中所体现的文学主张在明末清初时期对文坛有着非常大的影响。钱谦益曾三笺杜诗,自从《读杜小笺》中第一次提出诗史观念,推出了杜诗以史证诗的观点之后,就不断将其深化发展,《读杜二笺》对他的诗史观的阐述有所补充,提出了以诗正史说法,而《钱注杜诗》则进一步深化了诗史观,将以诗补史纳入了史诗互证的观点之中。《钱注杜诗》在强调了杜诗写作技巧的同时,所反映出的诗史
在不同的领域中,研究者通常应用非线性发展方程来描述相关领域的非线性现象。从理论层面上探索各类非线性问题,最直观的方法就是得到对应非线性发展方程的解析解。本文的主要内容是通过研究光学、流体力学以及凝聚态物理等诸多领域中的非线性发展方程,讨论连续与离散物理模型中的畸形波、孤子、lump波和周期波等不同的非线性现象。本文的主要安排如下:第一章简要介绍以孤子、畸形波和lump波解为代表的非线性波的研究进展
进入21世纪以来,复杂网络科学在各个科学领域都受到了广泛关注。复杂网络的相关概念为人们认识客观系统复杂性提供了一个切入点,并对复杂系统建模提供了坚实的基础。同时,基于它发展起来的一系列方法也为大家分析和控制复杂系统提供了有力的工具。目前,复杂网络领域中有两个方面尤为受大家关注:其一是网络结构对于系统的功能和动力学行为的影响,即从结构到动力学输出的所谓“正问题”。特别是当简单的动力学单元通过复杂的结
随着移动互联网高速发展,传统的网络管理技术在性能管理以及安全管理领域的发展相对滞后,成为了移动互联网发展的瓶颈。因此,针对移动互联网的网络管理技术的研究具有十分重要的理论意义和应用价值。本文针对性能管理中的用户感知质量(Quality of Experience,QoE)评价准确性的问题、安全管理中的有效构建病毒检测模型问题以及性能管理中的有效分析LOG日志问题等三个大方面展开了深入的研究。首先,
在人们的日常沟通交流中,作为一种无声的表现形式,人脸表情具有强大的表达能力。作为比人脸表情更为客观的表述方式,面部活动单元描述的是由于人脸肌肉拉扯而反映在面部的区域变化。Facial Action Coding System (FACS)系统将这一面部活动单元简称为Action Unit(AU)。在AU检测任务中,有两个非常重要的问题,一个是结构化的区域学习,另一个是多标签学习。在结构化区域学习研
各种移动互联网业务为移动用户提供更加极致的用户体验,如虚拟现实、超高清3D视频、移动云雾等,同时这些业务也对高速传输提出了迫切的需求。然而,可用的频谱资源是有限的,按照现有的通信理论和技术框架,很难达到未来无线通信超大连接数、超高速率、超高可靠性、超低时延的要求,因此迫切需要在高频谱效率方面有突破性进展。在此背景下,李道本教授创造性地提出了具有颠覆性创新的重叠X 域复用(Overlapped X
随着移动互联网的发展,社会媒体(social media)已经成为人们获取信息、交换信息的主要场所,分析理解这些多模态社会媒体数据具有广泛的应用需求和应用价值。社会媒体数据呈现出底层特征异构、高层语义关联的特性。一方面,单一模态描述力不足,不同模态数据提供了不同层次的语义信息,并且互为补充,需要有效组织多种模态的数据,以真正反映社会媒体内容。另一方面,多模态数据处于异构特征空间,不同模态间的数据关