论文部分内容阅读
近年来,随着电子商务的快速发展,网购评论作为传统口碑的数字化版本已经成为网络消费评价的最主要信息来源之一。一方面,大量的理论研究和实践应用表明,网购评论信息所蕴含的消费者对于所购商品的情感倾向,不仅对于后续潜在消费者的购买决策具有重要影响,同时对于网络电商持续优化经营策略、提升服务和商品品质同样具有十分重要的指导意义;另一方面,由于不同消费者及商家对于商品特性的关注点往往各有不同,进而导致传统的基于网购评论信息整体情感极性分析而获得的粗粒度分析结果,已经无法满足客户需求日益多样化的现实需求。基于上述背景,本文以电商网站关于手机的网购评论数据为基础,将情感分析作用于商品的不同属性,开展了网购评论信息细粒度情感分析方法研究。 本文在总结国内外情感分析理论及其主要研究成果基础之上,结合论文研究重点,所开展的主要研究工作主要包括以下三个方面: (1)针对原始网购评论信息中存在着大量的非观点句问题,为消除非观点句对于情感分析所造成的不利影响,提出了一种基于句子向量及SVM算法的网购评论观点句提取方法。该方法首先利用Google基于深度学习开发的词向量生成工具word2vec生成网购评论中词语对应的词向量,然后结合词语对句子语义的贡献率分析,利用词向量及正态分布公式构建句子向量,最后以句子向量作为SVM算法的特征输入,进行评论语料观点句的提取; (2)基于实验语料库,在实证研究基于欧氏距离、余弦距离的情感词、属性词语义相似度分类规律基础上,提出了一种基于语义相似度计算的情感词-属性词提取方法。该方法将情感词与属性词的提取视作二分类问题,将情感词、属性词的语义相似度阈值作为分类标准,结合分类算法实现了对情感词及属性词的自动提取和匹配,同时针对评论语料中的隐式属性问题提出了相应的提取方法; (3)将情感倾向从传统的正向、负向扩展为褒义、贬义、中性及兼有褒贬四大类,通过对传统基于字的情感词倾向程度计算方法进行改进,实现了对网购评论的细粒度情感倾向计算。