【摘 要】
:
当今世界,信息的表现形式越来越多样化,每天都有成千上万的信息尤其是多种模态的信息在网络媒体上发布。跨媒体检索面向大数据应用和网络空间安全等国家战略需求,多媒体内容理解技术及其应用对于有害信息识别、智能医疗、热点事件分析、多模态数据利用和军事战略分析等领域具有重要意义。海量的多种模态的数据“怎么管”和“怎么用”是目前人们需要考虑的难题。跨媒体检索是指提交任何一种模态的数据,获得相似语义的不同模态的数
论文部分内容阅读
当今世界,信息的表现形式越来越多样化,每天都有成千上万的信息尤其是多种模态的信息在网络媒体上发布。跨媒体检索面向大数据应用和网络空间安全等国家战略需求,多媒体内容理解技术及其应用对于有害信息识别、智能医疗、热点事件分析、多模态数据利用和军事战略分析等领域具有重要意义。海量的多种模态的数据“怎么管”和“怎么用”是目前人们需要考虑的难题。跨媒体检索是指提交任何一种模态的数据,获得相似语义的不同模态的数据。现在跨媒体检索仍然面临许多挑战,一方面,不同形式的跨媒体数据的底层特征维度和属性差异很大,很难直接度量数据之间在底层特征上的相似度。另一方面,媒体数据的语义信息是抽象的,不同形式的媒体数据之间的语义关联是抽象的。为了解决上述问题,本文针对不同的检索任务做了深入研究,综合分析了不同媒体特征之间的语义信息和相关性,提出了嵌入空间特征表示思想和模态依赖思想。嵌入空间特征表示具体来讲就是对底层的多模态数据特征通过一定的方式进行优化,形成一个嵌入空间表示。然后从嵌入文本增强空间投影,得到更有效的目标矩阵。在嵌入空间中,不仅可以进行更准确的跨媒体检索任务,还可进行细粒度检索的研究。模态依赖是指针对不同的检索任务学习不同的矩阵,同时用相似性矩阵进行加权优化,以保证回归过程中检索模态特征的准确性,从而提高检索效率。本文的主要贡献如下:(1)文本特征深度聚合。针对图像特征提取过程中噪音过大的问题,文本特征往往具有较强的判别能力,考虑联合优化图像特征和文本特征之间的相关关系,利用线性判别分析将文本特征的强判别性通过子空间迁移到图像特征上,进一步提高检索效率。(2)图像特征联合优化。针对图像特征存在的噪音过大和语义鸿沟问题,本文通过联合两种流行的降维方式,在整体和局部同时对图像特征进行优化,有效地提高了图像特征的判别能力。
其他文献
随着环境污染越来越严重,我国对化工工艺过程中的废物排放问题也越来越重视,化工工业亟需一个系统性设计方案来达成单元或装置内的废物最小化目标。质量集成(Mass Integratio
近红外光谱信号谱峰重叠严重,传统化学计量学方法不考虑光谱中隐含的实际物理与化学意义,任意环节的变动都会造成最终建立的近红外光谱分析模型的差异,这样的分析模型不具有
目前稠油的开采量逐渐增加,稠油中的胶质沥青质含量较高,从而导致了稠油黏度较高,如何高效降黏仍然是亟待解决的问题。本文使用分子动力学模拟软件,对不同电场作用下,稠油体
移动互联网的不断发展使得互联网用户的群体不断壮大,网络上产生了海量的数据信息并且呈爆发式增长。你可能曾经遇到过这样的场景:当你因为对文章的标题感兴趣而点开文章连接时,你发现文章的内容与标题毫无关系。如何快速在这些海量信息中准确的获取我们需要的文本信息具有非常重要的研究价值,文本摘要生成技术作为解决这一难题的重要技术应运而生。随着对信息技术和人工智能研究的不断深入,文本自动摘要生成技术成为主流方法,
诸广山地区热液型铀矿床中广泛发育红色微晶石英脉型矿石,因含大量细小分散状赤铁矿而呈现红色,且该类型矿石品位通常与赤铁矿含量呈正相关,但赤铁矿与常见铀矿物沥青铀矿形
汽油中的有机硫燃烧后会造成严重的环境危害,如酸雨、雾霾等,因此许多国家和地区已经严格立法控制汽油中的有机硫含量。我国由于特殊的汽油构成催化裂化汽油占比巨大,深度脱
离子液体(ionic liquid,IL)具有高CO2溶解能力、不挥发和结构可设计等优点,是新一代绿色溶剂,近年来有很多学者将其用于温室气体CO2的吸收和捕集。支撑型离子液体膜(supported i
本文以普通纺织品和具有多功能的石墨烯纺织品为研究对象,通过拉曼光谱技术对多种纺织品进行检测与识别研究。普通纺织品包括锦纶、涤纶、粘胶、腈纶、丙纶、醋酸、维纶、氨
伴随着国土资源条件的日益紧张,粗放式、低密度的高校建设模式已逐步成为旧时代的产物。由速度转向质量、由粗犷式转向内涵式的集约型高校发展方式成为当下高校建设的必然选
广东处于中国大陆低纬度地带,面临广阔的海洋,属热带和亚热带季风气候区,历来为自然灾害多发区域。灾荒影响到劳动人民农事生产生活的方方面面,如果救荒赈灾过程中滋生贪污腐