社交网络跨媒体国民安全语义学习与微博话题搜索的研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:laobi87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的普及,越来越多的用户通过社交平台传递信息,使得大量数据在社交网络上快速、广泛传播。社交网络中数据的存在形式不单是文本,还存在着图像、视频等多种类型。因此提取跨媒体数据中的语义信息,完成数据在统一语义空间中的特征表达具有重大意义。同时,用户在社交平台上的信息搜索需求日益增加。对于微博等平台上文本字数的限制问题,研究查询扩展的方法来满足用户搜索需求成为热点。本文完成的主要工作如下:(1)通过对原始AlexNet 网络结构进行改进,提出了一个针对社交网络数据特征提取的新型AlexNet-Social神经网络模型。AlexNet-Social神经网络模型可以更为有效地提取社交网络数据的深度语义信息,并减少模型参数计算量。在社交网络图像数据集上进行实验,AlexNet-Social神经网络模型的分类准确度指标比改进前的模型提升约5.6%,AlexNet-Social模型的训练效率比改进前的模型提升约36%。(2)提出了一个针对社交网络国民安全类事件的跨媒体语义模型CSMBA(Cross-modal Semantic Model Based on AlexNet-Social),模型采用深度神经网络分别提取文本与图像数据的特征,并采用注意力机制完成了两种语义特征的统一表达。在社交网络文本与图像数据集上,CSMBA模型对相关事件识别任务的精确率、召回值、F值评价指标相比对比模型均有较大提升。(3)提出了一个结合社交特性与时间因素的微博搜索算法WSAST(Weibo Searching Algorithm Combining Social and Time Factors)。在查询词拓展方面,提出了结合语义相似度与时间相似度进行查询词扩展的方法,不但利用了微博文本中的语义信息,而且考虑词语的时间分布状况。在搜索结果重排方面,采用结合文本词频与微博热度的重排,充分利用微博用户参与的社交特性来优化搜索结果。实验表明WSAST算法在搜索准确率指标上相比其他对比算法有最好的表现。WSAST算法有效地提高了微博搜索的表现,较好地满足用户的搜索需求。(4)设计实现了微博国民安全事件识别与话题搜索系统。通过需求分析确定系统的五个功能模块:数据预处理功能模块、国民安全事件数据库建立模块、国民安全事件类别扩展模块、微博话题搜索模块与系统可视化模块。对系统功能进行了测试,测试结果表明系统可以满足识别微博中国民安全事件以及优化用户搜索的需求。
其他文献
首先对网络新闻评论数据的特点进行归纳总结,选取不同的特征集、特征维度、权重计算方法和词性等因素进行分类测试,并对实验结果进行分析比较。对比结果表明:情感词和论据词
<正>一、湄潭茶文化产业的比较优势1.茶产业发展优势陆羽《茶经》记载:"黔中生思州、播州、费州、夷州……往往得之,其味极佳。"经茶史专家考证,当年《茶经》所载的行政区域
求解Job Shop调度问题是个NP完全问题,为了提高遗传算法的性能,提出一种新的自适应遗传算法(NSGA)以解决Job Shop调度问题。采用活动调度解码方法、过滤个体适应度相同的筛选
以实际工程为例,对高速公路桥梁施工中注浆技术的应用进行探讨。
戴表元诗文理论是在对南宋末诗文风气的批评中确立并形成的。在诗歌方面,他提出的宗唐理论有其特定内涵和背景,其核心是在向唐人学习的同时,也要借鉴《诗经》、乐府诗和建安
随着城市建设的不断推进,城市空间规划须纳入设计重点。城市空间规划既有近期发展意义,也有长远发展意义。以战略性发展导向出发,有效协调重要政府机构与其它主体结构的共同
ACP是一种适用于多组共享环境的路由器缓存管理协议。在突发数据流频繁出现的互联网中,当多播组数量或者组成员发生变化时,ACP分配算法暴露出慢收敛和分配结果不稳定等问题。
针对传统的基于用户的协同过滤(UCF)模型在相似性度量过程中没有充分考虑项目属性的问题,提出了两种考虑项目属性的协同过滤推荐模型。模型首先对用户评分相似性进行优化;然
本文分析了47例颈椎病引起食管压迫的临床及X线表现。本病并非少见,可有或无吞咽障碍.引起吞咽障碍的机制有骨赘或椎间盘前脱突出的机械性压迫和神经功能障碍。本病之诊断应依