基于微博评论的情感分析研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:aulanb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我们的日常生活中,互联网是越来越普遍,人们使用互联网的频率也在快速上升的,比如大家可以通过网页或者微博来上网,观看其他人发表的言论,自己也可以在上面发表相应的评论。每天都有大量的有意义的评论产生的,我们可以从这些评论中来感知发表人的信息,同时也可以知道发表人的观点想法等等。的在中国,有很多关于情感分析方面的研究,于是也就有人开始对微博中的评论展开研究了。我们在搜集了大量的微博研究的相关文献之后,发现目前使用最多的研究方法有情感词典的方法,也就是通过构建相应的微博情感词典,进而来分析微博评论的极性;还有一种方法是采用机器学习的方法,也就是通过一些构建模型,通过模型来判断文字的正负的。我们都知道的,中华文化源远流长,是非常丰富的,语言含义非常丰富,比英文单词的复杂性要高很多,很多单字与组成的词意思相差很多,对于有很多个有关系的单词组成的词语的含义,有时使用一些模型算法的效果并不是很好。另一方面,在情感极性的分类过程中,基于情感词典的分类方法几乎没有在乎到微博话题领域的词汇,从而影响了情感分类结果的正确性。目前,在国内,鲜有文献对微博的情感分析有很深入的研究,比如通常会忽视发表言论的人的情感强度,另外一些算法也稍有欠缺,同时对于特征项也很难准确提取。在搜集了其他研究者对于微博评论研究的文献并仔细查阅之后,发现采用情感词典的方法对于情感分析研究是一个不错的选择,另外由于微博有它自己的特殊性,与其他评论研究会有一点不同,所以我们建立了专属于微博的情感词典,选择相关的微博评论,提高情感分类的准确率。我们在获得相关的评论文本之后,首先要对它进行预处理,使其方便后续的研究,然后,使用我们专属于微博的情感词典,对其进行特征提取等操作,和相应的处理消极词汇、程度副词、微博表情符号、情感词和评价对象的微博评论。最后,将采用一些算法公式,对前面已经处理好的数据进行正负分类,达到一个准确的分类效果。我们将会在微博上挑选一些热点话题,实验数据包含生活、交通事故、微博话题领域的科学和技术三个领域,最后的结果通过实验验证是比较合理的。
其他文献
<正>1 技术特点FA319型并条机是天门纺机有限公司在调研吸取国外并条机先进技术,结合国内需求,总结长期制造并条机经验基础上新研制的可供精梳条单并的高速并条机,该机配有洛
会议
<正>为了让自己制作的报表更好看,少不了要对Excel图表进行配色。不过毕竟不是人人都专业,对于图表的配色,除了简单填充颜色或者套用模板外,普通人几乎做不出专业的配色方案
期刊
<正>近年来,人力资源服务产业园作为国家和地方政府支持人力资源服务产业发展、为经济和社会进步提供人才和管理支撑的重要手段,已取得了良好的社会效应。本期人社会客厅邀请
<正> 汽车油漆的修补是一个系统工程.产品的品质和施工工艺都会对最后的结果产生重大影响。以下.将与读者分享一些由于各种原因引起的漆膜问题:
自从60年代初《中国民歌集成》的采风工作开展以来,民族音乐学的科研工作便实际上成了国内广大音乐工作者普遍的实践课题。同样,自从50年代中期,国内主要的音乐院校开办有关
融媒体时代下意味着传统文化有了全新的传播路径和平台,但是在传统文化的传播过程中也面临着诸多的问题和阻碍。本文围绕融媒体时代下传统文化传播的创新路径进行系统的论述
室内设计中&#39;少&#39;限制的理念要求设计中尽可能少地运用物性视觉元素,从而给人带来尽可能多的想象创造空间.具体来说,少限制就是要尽量突破风格限制、摆脱功能限制,打破
在国内英语教学中,教授语法常以句子为基础。但在英语中很少有语法脱离语篇而独立存在的现象;当教师以句子为单位教授语法时,在对第二语言和外语的教学和测试中,就会显露其负
20世纪90年代末以来,随着韩国影视剧、韩国流行音乐、韩国明星大举登陆中国大陆,韩国文化风行一时,引发了所谓"韩流"现象.青少年炮制并演绎着的这一轮新的文化浪潮,是否是青
企业外宣英译的质量决定了企业产品是否可以顺利走向世界。本文以衢州地区企业为例,从语言层面和文化层面探讨企业外宣英译存在的问题和应对策略。 The quality of English