多标记学习算法研究及其在图像语义理解中的应用

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:xujinchang5280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着海量图像和多媒体社交数据的指数级增长,多标记学习因其丰富而完整的语义表示可以有效应对复杂场景下的不同用户需求,广泛应用于文本分类、图像识别与标注、多媒体音视频内容分析、生物医疗诊断和个性化推荐等领域。现有的多标记学习算法主要面临四大挑战:训练样本数量巨大而已标注样本数据却非常有限;标记之间的相关性利用不充分,已标注样本的标签集合中存在噪声数据和缺失项;输入数据特征表示不全面。针对上述问题,本文提出了两种多标记学习算法并将其应用于图像语义理解领域。基于半监督对偶低秩特征映射的多标记图像标注算法。该算法针对训练数据中存在大量未标注样本且已标注样本的标签存在噪声的情况,创新性的引入线性自修复模型修复原始标签矩阵中存在的噪声项和缺失项,同时还可以保证标签空间的低秩结构特性。为了充分利用样本标签之间的相关性,引入基于特征映射矩阵和自修复模型系数矩阵的对偶低秩迹范数正则项,同时用于控制模型复杂度。另外,图拉普拉斯正则项的引入有利于充分利用训练数据中的大量未标注样本,通过衡量样本几何结构的相似性维持其局部流形结构,为预测模型提供更好的样本数据支撑。大量实验证明,该方法具有非常优异的标注性能,尤其在训练样本不足和标签矩阵不完备的情况下更可以体现出自己的优势。基于块特征语义隐变量模型的多标记学习算法。该算法针对以往大多数多标记学习算法忽略输入数据的特征表示,当图像中包含复杂高层语义概念时导致“语义鸿沟”问题出现的情况。本文创造性地引入隐变量模型从概率统计学角度对图像原始特征做再表示,即原始输入图像的分块特征是输入特征初表示,也叫低层特征表示;分块特征基于隐变量模型映射得到的特征是输入特征再表示,即中层特征表示;最后用中层特征去映射与输出标记空间(即高层语义)的对应关系。隐变量的引入不仅有利于从全局角度挖掘图像子块间的隐含关系,同时还有助于数据降维,加速模型建立。图像分块和图拉普拉斯正则项的引入则从局部空间层面利用图像子块间的内部几何信息和关联性。大量实验证明本文提出的算法在图像语义理解领域具有非常不错的标注性能。另外本文利用Matlab平台实现了一个基于此算法模型的简单的图像标注系统,其可对包含复杂高层语义概念的图像做很好的预测。
其他文献
以西湖龙井村的整治更新为例,阐述了休闲的理念,指出休闲环境是一个多元复合的环境,并从休闲硬环境和休闲软环境两个层面探讨了具体的更新措施,最后提出创造多元化的休闲空间
高填石路堤地基沉降受施工情况影响,填筑阶段和非填筑阶段地基沉降规律明显不同,因而不能采用统一的地基沉降与时间关系的表达式来描述地基各阶段沉降规律。填筑阶段,提出了
采用室内培养实验研究了生物炭对中性水稻土养分、微生物量和磷脂脂肪酸(PLFA)特征的影响。试验采用玉米秸秆生物炭(炭化温度500℃),分别按照炭土质量比0(CK)、1%(T1)、2%(T2
目的:探讨肿瘤相关物质群(TSGF)检测在恶性肿瘤诊断及疗效评价中的临床意义.方法:应用TSGF快速检测试剂盒检测血清TSGF水平.病例组为恶性肿瘤255例、感染性疾病117例、自身免
悬瓮山下的晋祠,是山西省太原市的名胜之一,是一部用建筑语言书写的太原通志。在这部通志里,最精彩的手笔,应当是圣母殿中的四十三尊宋代彩塑。 Jinci hanging mountain und
本文从平行研究的定义、存在依据、研究途径三方面来论述作为比较文学研究方法之一的平行研究 ,从民间文学等学科的研究成果为平行研究的存在提供了合理性依据 ,在操作层面上
研究了以硅酸钠作为激发剂制备的碱磷渣水泥的特点及硅酸钠的模数、掺量和磷渣的比表面积对碱磷渣水泥性能的影响.结果表明:硅酸钠模数为1.2~1.5时碱磷渣水泥的抗压强度最高,并
前段时间热映的一部科幻电影《盗梦空间》(又名《奠基》),带观众游走于梦境与现实之间,被定义为"发生在意识结构内的当代动作科幻片"[1]。在这部科幻电影中,盗梦小组短短几分钟就
热防护是高超声速飞行器设计与制造的关键技术之一。对高超声速飞行器热防护材料进行了归纳总结,其常用材料主要有C/C复合材料和超高温陶瓷。针对各自材料的优缺点,提出了高