基于图模型的多模态社会媒体分析

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:nieaobama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展,社会媒体(social media)已经成为人们获取信息、交换信息的主要场所,分析理解这些多模态社会媒体数据具有广泛的应用需求和应用价值。社会媒体数据呈现出底层特征异构、高层语义关联的特性。一方面,单一模态描述力不足,不同模态数据提供了不同层次的语义信息,并且互为补充,需要有效组织多种模态的数据,以真正反映社会媒体内容。另一方面,多模态数据处于异构特征空间,不同模态间的数据关联关系复杂多样,需要研究多模态数据间的互联与共享机制,以建立跨模态数据的关联通道。本文针对社会媒体数据不同模态间的语义互补性与空间异构性等特点,对基于多模态的社会媒体分析与检索问题进行了深入研究。论文的主要工作有:1.针对多模态的社会媒体表达进行了研究。社会媒体中,图像内容提供底层视觉特征,上下文提供了高层语义特征,多模态信息会比单一模态信息提供更多的信息量。提出了一种基于视觉内容的特征融合方式作为社会媒体的表示方法,将上下文信息作为正则项约束图像视觉特征,在此基础上进行非负矩阵分解,寻求一个将语义信息融入图像特征的隐含空间来表示社会媒体。实验结果表明,基于内容的社会媒体融合表示与基于上下文的媒体融合表示具有互补性,结合这两种特征表达方式得到了较好的结果;2.针对多模态融合与多标签关联相结合的直推式社会媒体分类进行了研究。多标签是社会媒体中除多模态之外另一个显著的特性。多模态从不同视角来表达社会媒体的内容,而多标签阐述了社会媒体中对象的共生关系。两者从不同方面对社会媒体内容进行了描述。针对这两个特点,本文提出了一种基于超图的直推式学习算法,在多模态融合的基础上结合了多标签关联的特性。首先,针对多模态融合,提出了一种新颖的多模态融合算法,通过构建一个统一的超图来有效地组织多模态异构数据。针对该融合策略中存在的计算效率低的问题,在统一的多模态超图基础上改进了超图的构建方式,提出了一种高效的多模态超图构建方法。其次,针对多标签关联,通过构建一个标签间的关联超图来表示对象间复杂的关联关系。算法通过联合使用多模态超图与多标签超图,自适应地学习超边权重与标签得分来对社会媒体内容进行分析。在两个真实的社会图像数据集Pascal VOC 07与MIR Flickr中的实验结果表明,所提算法优于目前其他直推式学习算法;3.针对用户标签的社会媒体相关性分析进行了研究。用户生成的标签是社会媒体的一个显著特性。用户标签的不规范性与主观性使得不能直接通过用户标签获取相关的社会媒体内容。本文提出了超边关联的超图模型,在超图学习中引入了超边间的高阶关系。针对用户标签“错标”与“漏标”的情况,简化了超边关联的超图,提出了文本-视觉二阶混合超边的超图构建方法。在快速构建超图的前提下,减小视觉词汇与文本词汇中噪声的影响,通过优化超边权重的策略减小了具有歧义的混合超边对算法性能的影响。同时,提出了基于bagging的超边随机选择方法,通过并行算法解决混合超边数量过多的问题。实验结果表明该方法在基于用户标签的社会媒体检索与标签分配两个任务中的性能要优于传统超图学习方法;4.基于高阶异构保持的跨模态关联学习。针对社会媒体用户标签稀疏且噪声多所导致的文本与图像信息不对称的跨模态关联这一问题,本文提出了一种利用高阶、语义与非线性相结合的跨模态关联学习算法。在建模多模态数据对内部强关联性的基础上,通过超图来描述社会媒体数据间的高阶关系,以此建模高阶的多模态数据对间的弱关联,通过权衡这两种关联进行跨模态关联学习。该方法强调了多模态对间关联性的作用,通过建立多模态对间的关联性,间接的扩大了训练集,从而缓解了社会媒体数据中文本稀疏与噪声多造成的难以进行跨模态关联的问题。在超图构建策略方面,分别针对有监督与非监督的应用场景,提出了基于语义类别标签的随机近邻挑选策略,强调了语义信息在跨模态关联中的作用。最后,对算法进行了 kernel扩展,强调了非线性在跨模态关联中的作用。在Wikipedia、Pascal与NUS-WIDE三个数据集上验证了算法的有效性。
其他文献
学位
学位
学位
杜甫,千百年来让人仰望的现实主义诗人,向世界展示的不仅是其不朽的作品,还有中华民族知识分子伟大的人格。享有"诗圣"之美誉,为历代文人士子们的学习典范,同时,其作品以其记实性与叙事性而被誉为"诗史"。"诗史"的称号最早在唐代孟启的小说《本事诗》中被提起:"杜逢禄山之难,流离陇蜀,毕陈于诗,……故当时号为‘诗史’"。宋祁在《新唐书杜甫传》中也说:"甫又善陈时事,律切精深,至千言不少
期刊
《钱注杜诗》是明清之际的著名文学家钱谦益所著,该著作中所体现的文学主张在明末清初时期对文坛有着非常大的影响。钱谦益曾三笺杜诗,自从《读杜小笺》中第一次提出诗史观念,推出了杜诗以史证诗的观点之后,就不断将其深化发展,《读杜二笺》对他的诗史观的阐述有所补充,提出了以诗正史说法,而《钱注杜诗》则进一步深化了诗史观,将以诗补史纳入了史诗互证的观点之中。《钱注杜诗》在强调了杜诗写作技巧的同时,所反映出的诗史
在不同的领域中,研究者通常应用非线性发展方程来描述相关领域的非线性现象。从理论层面上探索各类非线性问题,最直观的方法就是得到对应非线性发展方程的解析解。本文的主要内容是通过研究光学、流体力学以及凝聚态物理等诸多领域中的非线性发展方程,讨论连续与离散物理模型中的畸形波、孤子、lump波和周期波等不同的非线性现象。本文的主要安排如下:第一章简要介绍以孤子、畸形波和lump波解为代表的非线性波的研究进展
进入21世纪以来,复杂网络科学在各个科学领域都受到了广泛关注。复杂网络的相关概念为人们认识客观系统复杂性提供了一个切入点,并对复杂系统建模提供了坚实的基础。同时,基于它发展起来的一系列方法也为大家分析和控制复杂系统提供了有力的工具。目前,复杂网络领域中有两个方面尤为受大家关注:其一是网络结构对于系统的功能和动力学行为的影响,即从结构到动力学输出的所谓“正问题”。特别是当简单的动力学单元通过复杂的结
随着移动互联网高速发展,传统的网络管理技术在性能管理以及安全管理领域的发展相对滞后,成为了移动互联网发展的瓶颈。因此,针对移动互联网的网络管理技术的研究具有十分重要的理论意义和应用价值。本文针对性能管理中的用户感知质量(Quality of Experience,QoE)评价准确性的问题、安全管理中的有效构建病毒检测模型问题以及性能管理中的有效分析LOG日志问题等三个大方面展开了深入的研究。首先,
在人们的日常沟通交流中,作为一种无声的表现形式,人脸表情具有强大的表达能力。作为比人脸表情更为客观的表述方式,面部活动单元描述的是由于人脸肌肉拉扯而反映在面部的区域变化。Facial Action Coding System (FACS)系统将这一面部活动单元简称为Action Unit(AU)。在AU检测任务中,有两个非常重要的问题,一个是结构化的区域学习,另一个是多标签学习。在结构化区域学习研
各种移动互联网业务为移动用户提供更加极致的用户体验,如虚拟现实、超高清3D视频、移动云雾等,同时这些业务也对高速传输提出了迫切的需求。然而,可用的频谱资源是有限的,按照现有的通信理论和技术框架,很难达到未来无线通信超大连接数、超高速率、超高可靠性、超低时延的要求,因此迫切需要在高频谱效率方面有突破性进展。在此背景下,李道本教授创造性地提出了具有颠覆性创新的重叠X 域复用(Overlapped X