论文部分内容阅读
电子商务的崛起使得消费者足不出户就能够买到自己心仪的商品,极大的方便了消费者,Web2.0的普及使得消费者购买商品后在网络上发表商品评论成为一种习惯。商品评论是消费者使用商品的主观感受,能够表达消费者的情感倾向,与商家提供的商品信息相比,由消费者发布的商品评论可信度更高。使用情感分析技术挖掘商品评论中的情感信息已经成为当今的研究热点,情感信息能够辅助消费者做出购买决策,能够帮助商家了解其竞争优势与劣势,能够为监管部门进行监管工作提供参考信息。商品评论中所蕴含的情感信息在一定程度上会对消费者的购买决策产生影响,这种影响会体现在易于得到的经济变量如商品销量情况或价格等的变化方面,挖掘在线评论文本中的情感信息与商品销售情况之间的关系是本文研究的主要内容。本文首先介绍了文本情感分析过程中涉及的相关基础理论,包括使用网络爬虫进行数据采集,使用分词、词性标注、文本特征表示对在线评论文本进行预处理,以及常用的情感分析方法。在此基础上,提出本文进行评论文本情感分析的方法,词语情感分析使用的是情感词典与点互信息-信息检索算法相结合的方法,在对评论语进情感分析时,考虑对其情感倾向方向或程度产生影响的因素,对这些因素进行相应的处理以提高评论语情感分析准确性。并以消费者会员等级和评论字数两个指标作为判断评论质量的依据,将评论质量对情感倾向的影响考虑到情感分析模型之中。随后将情感分析结果应用于商品销量预测中,选择自回归模型预测商品销量情况,并将情感因素和考虑评论质量的情感因素融入自回归模型中,提出面向短期预测的情感感知模型。为加强说服力,本文利用网络爬虫收集了三个电子商务网络购物平台真实的图书评论信息,使用相应评价指标对模型进行验证,结果表明改进后的模型性能有了一定的提高。