基于句子结构化特征的情感倾向分析

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:vuip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,随着数据挖掘与机器学习技术的不断发展,情感分析技术已经越来越受到人们的关注。情感分析可以应用于多个领域,包括舆情分析、商品评论分析等等,具有较大的商业价值与研究价值。本文的主要研究目标是句子级别的倾向判断,即给定一个句子,判断其所包含的情感含义是正倾向还是负倾向。本文的主要研究工作和成果:(1)首先,调研分析了当前情感倾向性分析的研究现状,重点调研了基于句法规则的方法和基于机器学习的方法,并分析了两种算法的优缺点。基于此,提出了本课题的研究框架:实现基于句法规则的基线系统,提出了改进的情感特征向量化方法以及其应用。(2)基于句法规则算法设计并实现了一个针对产品属性的情感分析系统。整个系统的处理包括以下四个子模块:实时预处理模块、词典生成模块、产品属性聚类模块、情感强度计算模块。该系统能够有效地分析亚马逊网站的英文商品评论数据。(3)针对句法规则算法的不足,提出了结构化情感特征向量空间模型(SEVSM)。该方法将句法依赖树简化为情感标签三元组,并将所有的三元组表示成情感特征向量。该方法的优点在于,既能够充分利用句法规则,又可以将非结构化的情感信息结构化,有利于直接采用各种机器学习算法。(4)通过COAE评测以及实验分析验证,设计并实现了基于SEVSM的情感分析算法。首先将SEVSM应用于各种传统的分类器;其次采用PCA、MDA以及tf-idf模型进行特征空间优化;然后对比了不同的先验情感强度量化信息下的系统性能;最后,针对上述分析,设计和实现了最优化的SEVSM,并同第三章的基线系统进行了对比。实验结果表明:第一,直接使用SEVSM进行情感分析能够取得不错的效果;第二,通过适当的优化可以改进SEVSM的性能;最后,SEVSM相对于传统的方法具有更优越的性能。
其他文献
随着中国的农业经济发展速度不断加快。为适应当前消费者对农业经济的需求,要高度重视农业经济管理,提高农产品质量,这也是农业发展的重要趋势。从目前农业经济管理的现状来
近年来,中国越来越重视社会信用体系的建设。2014年6月国务院印发社会信用体系建设顶层设计文件《社会信用体系建设规划纲要(2014年-2020年)》,明确了我国社会个人信用体系建
罗伯特·舒曼(Robert Schumann,1810-1856)是德国杰出的作曲家、钢琴家、音乐评论家,是19世纪浪漫主义音乐繁荣时期的典型代表人物之一。他以浪漫细腻、诗意幻想的艺术气质被
中共十八届三中全会提出“坚持走中国特色新型城镇化道路,推进以人为核心的城镇化,推动大中小城市和小城镇协调发展、产业和城镇融合发展,促进城镇化和新农村建设协调推进。”大
C银行是一家地方法人股份制商业银行,将支持小微企业作为银行市场定位的重点,随着利率市场化改革推进,以及直接融资市场的发展,小微企业信贷市场竞争加剧,在此背景下,研究制