基于文本倾向性分析技术的微博监控系统

被引量 : 5次 | 上传用户:qweewqqwe123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和移动技术的飞速发展,作为互联网媒体重要组成部分的微博迅速兴起,微博已经成为当下最流行的社交平台之一,越来越多的网民通过微博表达自己的观点和态度,尤其是结合手机移动终端,使得微博信息的分享和传播更加便捷。在此过程中,由于用户群体不一所以微博信息的内容也多样化,大量的个人观点充斥着整个互联网。对于政府、企业和网络安全等方面来说这些带有感情色彩的信息具有非常重要的意义,所以对微博这一社交媒体平台信息的检测和预警愈发重要。文本倾向性分析是对某一个话题的看法和立场进行数据挖掘和分析,从而得到该看法或评论的情感倾向是积极的还是消极的。这一技术可以广泛应用于话题分析、舆情分析、产品评论、市场调研、舆情预警等方面。目前将文本倾向性分析方法应用到微博文本分析中的系统还不多,而且微博情感倾向性分析方法还存在着准确率低,考虑不周全,缺乏对句子依存关系考虑等缺点。针对以上特点本文从微博自身特点出发,借鉴已有研究成果,改进现有的分析方法,提出一种有效的微博情感倾向性方法,最终设计并实现了微博监控系统。本文主要研究内容和创新点如下:1、研究现有的文本倾向性分析方法,主要从基于语义的文本倾向性分析技术出发,研究分析了基于词和短语模式和基于语义模式库的文本倾向性分析方法,并且对这两种方法进行了对比和总结。2、本文构建了一整套文本倾向性分析所需的情感词典,包括领域情感词典、基础情感词典、修饰副词词典、表情符号词典和网络词汇词典。提出了一种领域情感词典构建方法,使其能够自动扩展情感词库,减少了人工的干预。结合知网和汉语褒贬词典提出一种基础词典构建方法。3、结合1中方法本文提出了一种基于情感词典和短语模式的文本倾向性分析方法。首先分析了短语模式库,将短语表达方式归纳为六种短语模式,其次分析词与词之间的依存关系,最后结合情感词典和短语模式,对句子情感倾向进行计算,通过计算情感值判断情感倾向。4、本文结合网络爬虫技术、页面解析技术和文本预处理等技术提出并设计了一整套微博舆情监控系统。包括微博采集模块、分析模块和服务模块等等,最后通过系统测试表明系统符合预期的效果。
其他文献
全国中医专科建设工作会议今天开幕了。这次会议是在贯彻实施《国务院关于建立城镇职工基本医疗保险制度的决定》和《关于城镇医药卫生体制改革的指导意见》的新形势下召开
<正>前言宣传思想文化工作是我党工作中的一个极其重要的组成部分,正确认识当前宣传思想文化工作存在的问题并把握其规律,对开创新时期宣传思想文化工作新局面具有十分重要的
高速公路是社会和国民经济快速发展的基础设施,是实现社会流通、生产和消费协调发展的先决条件。近几年,为了应对金融危机,广东高速公路迅速发展,保证了广东省经济发展联动,
中国传统图案是由各个时代传承下来,具有中国民族特色和艺术风格的图案。而每个图案都凝聚着不同时期艺术家们的心血。本文主要从中国传统图案在游戏设计中的应用与价值研究
近年来,随着我国经济发展与城市化进程的推进,高层住宅区己经成为我国尤其是大中城市住宅的主要发展形式,以刚需化、市场化为主要特征的大城市高层住宅的发展正经历着从关注
<正>宿迁位于江苏省北部,这里是一片古老的土地,境内"下草湾文化遗址"在距今5万年前就有古人类逐水而居,是西楚霸王项羽的故乡,也是西汉的泗水古国,清乾隆皇帝六下江南五次驻
随着社会经济的飞速发展,农村土地耕作已逐步向了机械化,大批农村剩余劳力开始涌向城市,农村形成了大批的留守儿童。针对这部分儿童群体,如何采取行之有效的管理和教育措施,
<正>党的十八大明确宣布科学发展观为指导党和国家全部工作的强大思想武器,同马克思列宁主义、毛泽东思想、邓小平理论、"三个代表"重要思想一道,是中国共产党必须长期坚持的
介绍了绿色施工的概念,根据绿色施工质量管理的要求,建立了绿色施工质量管理程序,并从人员、材料、机械、施工方法、环境等方面,阐述了绿色施工质量管理措施,从而实现建筑工