【摘 要】
:
图像自动描述是一项结合了计算机视觉与自然语言处理两个领域的综合性任务。该任务很具有挑战性,主要在于图片中的目标、属性、场景以及彼此之间错综复杂的关系和自然语言的
论文部分内容阅读
图像自动描述是一项结合了计算机视觉与自然语言处理两个领域的综合性任务。该任务很具有挑战性,主要在于图片中的目标、属性、场景以及彼此之间错综复杂的关系和自然语言的灵活多样性。受基于编解码机制的机器翻译模型的启发,基于编解码机制的图像描述模型被提出,并在图像描述任务上取得了很大的性能提升。该算法使用卷积神经网络对图片提特征(编码),循环神经网络作为语言模型来生成图像描述语句(解码)。本文总结了现有图像描述方法的一些不足,并在传统的基于注意力机制的图像描述算法上增加了相关约束,同时探索视觉信息与语义信息之间的一致性与相关性。一致性是指文本语句的上下文关系,当给定上一时刻生成的单词以及当前时刻的视觉信息时,一致性试图最大化预测单词的概率,保证生成描述语句的语法逻辑正确性。而相关性是指视觉信息与文本语义信息之间的关系,保证了图像描述的内容与图片内容更相符,更相关。本文所提出的方法更具一般性,并在两个公共数据集上验证了算法的性能,分别为:Flickr30k和MS COCO。同时使用BLEU-1,2,3,4、Meteor、RougeL和CIDEr共7个评分矩阵来评估算法的性能。实验结果显示,相比于没有考虑相关性约束的算法,本文提出的算法在所有评分指标上都有很大的提升,生成的图像描述语句更具灵活性与多样性。
其他文献
目的:探索诱导骨髓基质干细胞(bone marrow stromal cells,BMSCs)分化为肝细胞的最适条件,并研究NF-κB和Ubc9在肝样定向分化中的表达,为BMSCs定向分化的分子生物学机制提供
视频传感器是一种广泛应用于各类突发公共事件感知的重要传感器,对保障社会安全、维护社会稳定起到突出作用。近年来,随着我国“平安城市”等工程的深入开展,全国各城市均加
燃料乙醇是目前公认的,也是最有发展前景的一种可再生清洁能源。以木质纤维素类生物质为原料生产燃料乙醇,不仅能够降低燃料乙醇在生产原料方面的成本,同时也在环境保护、废
在数据分析和数据挖掘领域,经常会出现数据缺失问题,其中特征缺失是缺失数据问题的一个重要分支。医疗、社会调查等领域的数据由于自身的特性,特征缺失数据的比例往往很高。
复杂网络抗攻击性问题是目前复杂网络领域研究的热点,对复杂网络的抗攻击性进行研究有助于构建更加健壮鲁棒的网络。目前的研究讨论了在有代价情形下进行节点攻击、在无代价
目标跟踪在计算机视觉的图像识别领域占据着越来越重要的地位。给定视频序列第一帧中目标的准确位置,目标跟踪算法需要学习目标第一帧的信息,并估计后续视频帧序列中目标的位
自由刑是刑罚种类中被适用范围最广的执行措施,而终身监禁是自由刑中最具严厉性和惩罚性的刑罚,在所有的刑罚中严厉程度仅次于死刑,同时又兼顾自由刑的优势和特色,因此在整个
胶乳是巴西橡胶树(Heveabrasiliensis)割胶后从乳管细胞(一种产胶组织)中流出的白色胶态悬浮液,是天然橡胶的主要来源。橡胶粒子是橡胶树乳管细胞中的一种特殊细胞器,是橡胶
巴西橡胶树(Hevea brasiliensis Muell.Arg.)属于大戟科(Euphorbiaceaae)三叶橡胶树属(Hevea)植物,又称三叶橡胶树或橡胶树。本研究的目的在于探讨橡胶树半年生组培苗木质部
目的:据世卫组织调查显示,酒精性肝损伤的发病人数在逐年增加,对人们的健康存在极大的威胁。我国藏区治疗肝病的经典复方二十五味松石丸,用药广泛,疗效显著。根据文献可知,二