融合局部语义信息的图像描述算法研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:jsw10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述技术能够将图像转为文本,实现信息的跨模态转换,因此被广泛用人机对话、图文互搜、儿童教育及视力障碍人士的生活辅助等方面。随着通信技术的提升,图像数据开始在互联网中被大量发布及传播,如何自动化地用自然语言描述图像内容,成为当前一大研究热点。本文针对图像描述的自动化生成问题,从基于情感表征的方法、基于局部空间语义信息的方法、基于图像描述的情感分析方法等方面进行深入研究。本文的研究工作主要包括:(1)提出了一种基于情感表征的图像描述方法:本方法基于编码器-解码器模型,先使用多个神经网络模型进行图像特征提取,再使用长短期记忆网络进行句子生成。首先采用现有工具提取图中的情感表征(包括视觉语义和表情),及其对应的矩形边界框。随后将视觉语义信息与表情信息表示为向量,并将之映射到特定的维度,作为LSTM的附加输入并参与训练和预测,从而使生成的句子具有感情色彩并提升图像描述的准确性。实验结果表明本方法能够有效提升图像描述的准确性,并且能够使生成的句子更具感情色彩。(2)提出了一种基于局部空间语义信息与全局信息的图像描述方法:首先使用现有的目标检测模型提取图像中存在的目标及其对应的矩形边界框,然后由注意力模型为每个矩形边界框赋予不同的权重,对双向网格LSTM(bi-Grid LSTM)的输入进行动态加权,从而使之在不同时刻关注不同的区域。实验结果表明本方法能够有效缓解图像描述中易丢失小面积目标的问题,较之现阶段方法性能更好。(3)提出了一种基于图像描述的社交网络数据情感分析方法:首先训练一个图像描述模型作为图像特征提取器,取其生成的描述句子,经过单层卷积作为图像特征。通过多层卷积的方式提取文本特征向量,然后将图像特征向量与文本特征向量进行拼接,输入到全连接层进行预测,从而现对社交网络数据情感倾向的自动化识别。实验证明本方法达到了比之该领域内同类方法更好的性能。
其他文献
将数码技术运用在公共空间设计中,可以便利地实现互动性的功能。本文结合实例对从公共空间的设计诉求分析、数码表达的语言建构,到如何保证数码表达在公共空间互动性设计中的
百合,是百合科百合属多年生球根植物,因其地下茎块呈球形,鳞片白色,重重叠叠,紧紧相抱,似百片合成,而得百合之名,后来人们又与"百年和合"、"百事合意"联系起来,把它作为吉祥
我国在城市化的进程中,每一个城市都呈现出几乎相同的城市空间的天际线。从城市建设角度来看,其中书报亭作为一种城市公共艺术——城市'家具',它以别具一格的魅力,展
<正>鹰的标本也许更适合张方白的绘画语言,更能体现那种生涩的苍茫感。通过张方白用自己独特的绘画语言的诠释,我们对鹰的理解被推向了一个新的境界,一种独特的精神力量的境
正始诗人阮籍在目睹了司马氏集团残杀异己的一幕幕惨剧之后,终于由一个“本有济世志”的儒学之士变成了一个“口不臧否人物”,整日与酒为伍的竹林名士,他虽然表面放浪行骸,纵酒任
本文以受众感受为出发点,主张在当今商业广告普遍求新求异的大趋势中,设计者应跳出思维惯势,做一些有益的逆向思考,以简胜繁,以朴胜奇,以周边知识激活专业知识,探索接受效果
清代民间宗族祭礼富有特色,反映宗族制的一些特点:祭礼发生重大变异,导致宗族规模扩大:祭祀始迁祖,突破朝廷只祭高曾祖祢四代的限制,从而宗族成员大大超出服制范围,规模变大,
<正>改革开放以来的中国外交经历了三个重要历史发展时期,外交工作取得了重要成就。20世纪70年代末到80年代末,邓小平对国际形势和时代主题作出了新的科学判断,指出和平与发
大学毕业生常将毕业前的实习视为自己未来的就业前站,而毕业实习生与实习单位以及所在院校签署的就业协议书的法律性质却常常被人们所忽略。用人单位降低成本的做法,也常伤及
随着金融危机的不断蔓延,财务管理成为企业管理的核心问题。文章通过阐述财务风险的概念、种类和表现,提出预防财务风险的政策和措施,为企业树立风险意识,制定风险防范措施,