论文部分内容阅读
随着在线社交网络的日益普及与流行,越来越多的用户通过社交网络平台发布信息、分享生活状态及搜索自己感兴趣的话题。在线社交网络积累了海量的跨媒体大数据,这些数据具有较强的动态性、上下文稀疏性以及跨媒体语义鸿沟,同时,社交网络中用户搜索意图较难理解。上述问题给在线社交网络跨媒体搜索带来了严峻的挑战和阻碍,因此,开展基于用户搜索意图理解的在线社交网络跨媒体搜索研究重要的意义和应用价值。本文对在线社交网络跨媒体信息主题表达、基于用户聚合的在线社交网络用户搜索意图理解与挖掘、基于稀疏主题模型的在线社交网络突发话题发现及基于用户搜索意图理解的在线社交网络跨媒体搜索等四个方面的理论与技术开展研究。论文的主要研究成果和创新点如下:(1)针对当前在线社交网络文本主题表达算法无法克服上下文稀疏性及无法实现主题动态表达问题,提出了基于动态自聚合主题模型的在线社交网络文本主题表达算法(SCTE),构建了动态自聚合主题模型(SADTM),通过聚合短文本为长文档,解决了社交网络上下文稀疏性问题,结合学习到的主题分布推导当前的主题分布,实现了在线社交网络文本主题的动态表达。针对当前图像表达算法忽略了图像的中心特征问题,提出了基于互补注意力机制的在线社交网络图像主题表达算法(CAIE),通过构建互补注意力机制,获取了聚焦和一致的图像特征,实现了在线社交网络图像主题的表达。实验验证了提出的SCTE算法与CAIE算法在主题表达上的有效性。(2)针对当前主流的在线社交网络用户搜索意图理解与挖掘算法需要特定的隐私数据而不具有普适性问题,提出了基于用户聚合的在线社交网络用户搜索意图理解与挖掘算法(UAIU),构建了在线社交网络用户聚合主题模型(UATM),获取了用户搜索意图分布。通过利用RNN和IDF构建权重先验,并区分建模主题词和普通词,实现了在线社交网络词关系学习。综合获取的用户搜索意图分布和关注者意图分布,实现了在线社交网络用户搜索意图的理解与挖掘,而无需任何隐私数据,使得算法具有较强的普适性。实验验证了提出的基于用户聚合的在线社交网络用户搜索意图理解与挖掘算法(UAIU)的有效性。(3)针对当前的在线社交网络突发话题发现算法无法实现突发话题自动发现的问题,提出了基于稀疏主题模型的在线社交网络突发话题发现算法(SBTD),融合了“Spikeand Slab”先验中的平滑先验和弱平滑先验,构建了基于“Spike and Slab”先验的稀疏主题模型(SRTM),获取了在线社交网络突发话题分布和词分布,实现了突发话题的聚焦。通过二值开关变量来决定话题的来源,结合获取的突发话题分布和词分布,实现了社交网络突发话题的自动发现。基于新浪微博数据集设计了多组对比实验,实验结果验证了提出的SBTD算法的有效性。(4)针对在线社交网络跨媒体搜索难以理解用户搜索意图且面面临语义鸿沟问题,提出了基于用户搜索意图理解的在线社交网络跨媒体搜索算法(UCMS)。采用第三章提出的基于用户聚合的在线社交网络用户搜索意图理解算法指导文本语义的学习,建立了互补注意力机制,实现了在线社交网络跨媒体数据的关联。构建了在线社交网络跨媒体对抗学习机制,获取了跨媒体数据的语义一致性表示,实现了在线社交网络跨媒体精准搜索。实验结果验证了提出的基于用户搜索意图理解的在线社交网络跨媒体搜索算法(UCMS)的有效性。(5)综合利用本文提出的基于动态自聚合主题模型的在线社交网络文本主题表达算法(SCTE)、基于互补注意力机制的在线社交网络图像主题表达算法(CAIE)、基于用户聚合的在线社交网络用户搜索意图理解与挖掘算法(UAIU)、基于稀疏主题模型的在线社交网络突发话题发现算法(SBTD)及基于用户搜索意图理解的在线社交网络跨媒体搜索算法(UCMS),实现了基于用户搜索意图理解的在线社交网络跨媒体搜索系统,包括跨媒体信息主题表达模块、用户搜索意图理解与挖掘模块、在线社交网络突发话题发现模块及在线社交网络跨媒体搜索模块。