论文部分内容阅读
评论文本情感分析一般是指通过基于语义或者机器学习的方法对评论文本挖掘和分析并从中获取能够表达消费者评论态度的一些主观信息,如立场、建议、情绪等,在完成这些工作的之后对评论文本的情感倾向进行计算,并给出判断。近年来随着电子商务的发展,面向电子商务的评论文本情感分析研究已经成为了当前相关领域的重点研究课题。通过对相关商品的评论文本进行情感分析可以使买卖双方准确了解商品的优缺点及消费者对商品的评论。从而为卖方改进商品、制定合适的销售策略以及为买方根据自己的需求购买合适的商品提供有效依据。然而,由于传统的评论文本情感分析方法大都仅采用统计评论中褒、贬义词数量并对其进行分析得出评论判断结果,难以准确获取对评论的真实情感。论文针对传统评论文本情感分析方法存在的缺点,采用基于语义和机器学习的方法对评论文本情感分析问题进行研究验证论文中的方法可以提高情感分析准确率。具体工作如下:1.采用情感词典对评论文本进行特征提取,并构建分类模型进行评论文本情感分析。论文针对笔记本电脑领域评论文本的特点,综合考虑修饰词和评价搭配关系构建情感词典,并给出情感词典各要素词典的情感强度标注处理方法。论文构建的情感词典主要的主要元素包括评价要素、情感词/评价词、否定词、程度副词、转折词以及评价搭配关系,在处理完这些主要元素的情感倾向强度标注之后对评论文本的情感倾向进行计算,并通过实验证明修饰词典以及评价搭配词典对情感分类的有效性。2.采用隐含语义索引方法对评论文本进行特征变换,并构建分类模型进行评论文本情感分析。论文针对电子商务中分级打分问题的实际需求,采用隐含语义索引方法对评论文本进行文本模型表示并实现词-文档矩阵的维数约减,在此基础上利用核判别学习序列回归方法对训练样本集进行训练,获得的序列回归模型可以实现对评论文本的情感分级,并通过与VSM特征变换下的情感分析方法进行对比实验证明了基于隐含语义索引的评论文本情感序列回归方法对情感分析的有效性。