微博舆情挖掘技术的研究与应用

被引量 : 2次 | 上传用户:eternaty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的持续发展,使得微博等新媒体越来越成为信息发布和共享的新平台,然而信息的传播也伴随着大量的虚假、暴力、反动等信息,严重影响人们的正常生活。因此,我们有必要尽快建立适应新形势下的网络舆情挖掘模型。论文研究应用以微博为代表的短文本舆情挖掘技术,重点对微博特征提取与表示、话题发现与追踪以及话题情感分析等技术进行了研究。在微博特征提取与表示方面,本文提出了一种基于语义的图结构模型,将微博特征词映射为图模型的结点,将依存句法关系映射为图模型的边。该模型充分考虑了文本的语义信息,有效克服了传统方法中语义缺失的弊端。在话题发现与追踪技术方面,利用Single-Pass算法实现微博话题的发现,并对算法存在的问题进行了优化改进;通过对单条微博与微博话题影响力的定义和度量,实现微博热点话题的识别与提取。在话题情感分析领域,论文首先在褒贬义词典中挑选情感倾向明显的词语作为种子情感词,并利用同义词词林扩展获得较完整的情感词库,然后再结合依存句法分析尽量消除上下文环境对情感词的影响。与传统的短文本舆情挖掘模型相比,本文提出的模型可以更加真实地反映文本的语义信息,在中等大小的新浪微博数据集中测试显示:该模型取得了较好的性能。
其他文献
如果说批评是一种判断,则我们时常所接触到的艺术批评便很难算是健全的形态,因为这些批评多是一种理性判断;而作为对“判断”概念的常识性理解,并顾及艺术批评的特殊对象,我
我国烟叶烘烤最主要的燃料为煤炭,随着燃煤价格的攀升,烟草生产成本逐年增加,更为严重的是密集烤房作为烟叶烘烤的重要设备,其燃烧效率较低,烟囱排放烟气热损失一直高居不下,
1临床资料患者女性,57岁。因"阵发性心前区疼痛4年,加重1周"于2017-10-17入院。患者4年前因前壁心肌梗死在当地医院先后于左前降支(LAD)近段置入支架1枚,右冠状动脉(RCA)置入支架3
按照国家烟叶质量分级分组标准,烟叶可以划分为正组烟和副组烟。在烟制品生产过程中,副组烟是不符合生产要求的烟叶,在处理过程中将副组烟分离出来具有一定的必要性。目前烟
摘要针对无线传感器网络的能量均衡问题,基于一种度量局部能量均衡性能指标,提出了一种基于预测的分布式能量均衡路(Predicting-based Distributed Energy Balancing Routing, P
林则徐近代国防思想刍议汪志国林则徐是“中国近代史上第一个睁眼看世界的人”,①他生活在西方洋枪、洋炮和中国刀矛剑戟出现巨大反差的时代里,在西方列强“坚船利炮”面前,盲目
高中数学课程是重要的基础理论课。本文针对基于网络平台的高中数学改革情况,从改革内容、改革目标、解决的关键问题、实施方案和取得效果方面较详细阐述了此次的改革的实践
在纺织工业产品的生产过程中,质量控制贯穿整个过程,而织物疵点检测是其最重要的部分,疵点的存在会影响织物外观,严重降低了纺织产品的质量,进而降低了产品的价格。因此,减少
文章以沪昆线南山河大桥为研究背景,利用通用有限元软件ANSYS建立全桥有限元模型,分析桥梁主要病害出现的原因,提出相应的整治措施并通过现场试验验证加固方案的有效性,得到
由于我国资源的紧缺以及环境污染日益严重,国家开始关注运用和开发绿色建筑中的节能技术。由于建筑具有消耗自然资源、改变环境和转化资源的特点,绿色建筑这个理念,对环境、