面向感知的图像场景及情感分类算法研究

被引量 : 18次 | 上传用户:ma_1001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和计算机网络技术的发展,人们接触到的图像数据以前所未有的速度增长,越来越丰富的图像资源使用户难以在浩如烟海的数据中找到自己真正需要的信息。因此,对图像数据进行有效的分类组织成为目前迫切需要解决的问题。在图像的分类过程中,用户关心的是在概念层次上的图像内容,即图像所描述的对象、场景以及表达的情感等。但是,限于目前计算机对图像理解的技术水平,直接从图像的低层视觉特征推理出图像的高层语义还十分困难。本文从人的认知角度出发,以“视觉词包建模—语义主题建模—情感映射函数构建”为路线来弥合图像低层特征和高层语义之间的语义鸿沟。论文工作的前半部分主要研究图像的场景分类算法,着重讨论如何为图像构建符合用户感知的语义视觉词包模型,以及如何有效地融入上下文语义信息提取图像的语义主题以改进场景分类性能。论文工作的后半部分主要研究图像的情感分类算法,着重讨论如何基于视觉认知理论,建立有效的机器学习模型来解决图像的情感分类问题。(1)提出一种基于信息瓶颈理论的图像场景分类算法在基于“视觉词包模型(Bag of Visual Words)"的图像场景分类算法上,由于其性能在很大程度上依赖于视觉单词(Visual words),因此本文提出了一种基于信息瓶颈理论的图像场景分类算法,无需手工标注利用语义相似性生成视觉单词,这与目前依据视觉相似性生成视觉单词的思路有显著的区别。其原理是,首先基于图像的场景类别标签,采用高斯混合模型(GMM)将图像区域的低层视觉特征转换为表征语义类别标签的特征;其次,基于信息瓶颈理论(IB)依据语义相似性聚类生成语义视觉单词;最后以语义视觉单词的出现频率表示图像的场景内容,完成图像场景分类任务。(2)提出一种基于上下文语义信息的图像场景分类算法在基于“语义主题建模”的图像场景分类算法上,为了能同时克服视觉单词中存在的同义(一义多词)和多义(一词多义)问题,本文基于视觉认知理论,提出了一种基于上下文语义信息的图像场景分类算法,将图像区域的视觉特征相似性与语义概念相关性相结合构建语义主题。其原理是,首先采用概率潜在语义分析模型(pLSA)挖掘视觉单词之间的语义共生概率;其次利用马尔科夫随机场(MRF)理论中类别标记的伪似然度近似策略将图像区域的视觉特征相似性与语义概念相关性有机地集成起来,充分发挥这两种信息对于语义主题生成的贡献,最后以语义主题的出现频率表示场景内容,从而有效地提高场景分类算法的性能。(3)提出一种基于Affective-pLSA模型的图像情感分类算法针对图像的情感分类问题,本文基于视觉心理学的相关成果,提出了一种基于情感概率潜在语义分析(Affective-pLSA)模型的图像情感分类算法。与传统的算法不同,该算法并不是利用已有的机器学习算法建立低层视觉特征和高层情感语义之间的映射关系;而是针对图像情感分类问题的自身特点,改进概率潜在语义分析(pLSA)模型生成一种符合人类情感感知规则的Affective-pLSA模型,作为映射函数完成情感分类任务。算法的原理是基于视觉认知理论,即一幅图像的情感语义是由图像中视觉单词按照一定的共生规则组合表达的,首先以视觉单词间的共生概率值为基元构建图像的矩阵表示;其次利用Affective-pLSA模型学习图像的情感主题;最后采用多标记K近邻算法(ML-KNN),基于图像情感主题的出现频率进行情感分类。需要指出的是,传统的pLSA模型反映的是潜在主题与视觉单词本身的概率关系。而Affective-pLSA模型试图挖掘出反映图像某种情感语义信息的视觉单词的共生频率关系,即潜在主题与视觉单词共生频率的概率关系。而这种潜在主题与视觉单词共生频率的概率关系恰能有效地契合视觉认知理论。
其他文献
我国水资源匮乏,尤其是北方干旱、半干旱地区。神府东胜矿区(以下简称神东矿区)地处陕北黄土高原和毛乌素沙漠东南边缘接壤地带,是我国特大型煤炭生产基地,开采条件优良。随
本文按照历史发展的基本脉络与文学研究的基本角度,对汉魏晋南北文学中的寓言文学,以专题的形式作了梳理。本文将分六章,主要内容如下:绪论主要介绍本文的研究目的与意义,回顾
农村残疾人群体的养老保障问题也是社会保障的重要组成部分。本文选择“农村残疾人养老保险制度”作为研究对象,研究整理了我国的农村残疾人养老保险制度的现状,并将此与国外代
人类进入信息时代已有半个多世纪了,计算机已经从军用、商用逐渐深入到家家户户,影响着人类社会的每个角落。随着个人电脑的普及,作为计算机重要组成部分,大型机逐渐淡出了人
半导体分立器件产业是衡量国家综合实力的重要支柱性产业之一,这个庞大的产业主要由设计、制造、封装和测试构成,而测试是唯一贯穿生产和应用全过程的产业。因此半导体器件的
质谱技术因具有检测精确度高、分析速度快、灵敏度高等优点,已成为分析科学中不可或缺的分析工具之一。特别是各种色谱与多种模式的质谱的联用技术,集色谱的强大分离能力和质
目的:(1)探讨C反应蛋白(C reactive protein, CRP)基因(+1059G>C rs1800947,+1444C>Trs1130864)的基因多态性、单倍型与慢性牙周炎(chronic periodontitis,CP)、冠心病(corona
<正>"我总觉得这节课有什么地方不对,没有上到学生的心坎……他们一直兴致不高,各位老师给提提意见吧……"《鞋匠的儿子》一课上完后,仇教师在进行教后反思时这样说。于是,听
通过分析反潜编队应召搜索的特点、实施时机,根据对潜搜索需要进行的战术计算,建立了反潜编队对潜搜索能力模型并进行了解算,对应召搜索的效果进行了评估,为实际反潜作战中提高对
环阿屯醇为植物甾醇类化合物,也是诸多甾醇类化合物生物合成的关键前体物质之一,具有抗炎、抗肿瘤、抗氧化、抗菌、抗阿尔兹海默症等多种活性,且在植物的生长发育过程中扮演