论文部分内容阅读
随着生鲜电商平台的飞速发展,消费者越来越热衷于在网络上创造以各自消费体验为内容的在线评论,这些评论也已变成购买产品或者服务的主要参考依据。由于评论文本是非常多且包含多维度特征的非结构化数据,因此需要通过大数据的方法进行识别。本文从生鲜电商在线评论文本的情感分析和有用性预测的角度来寻找消费者网购生鲜产品关注点和提取顾客对产品的评论观点维度,帮助潜在顾客做出购买决定和指导生鲜电商平台将有用性更高的在线评论推送给用户。
本文将在线评论情感分析和有用性的研究拓展至生鲜电商领域,利用爬虫技术获取生鲜商品在线评论文本的真实数据集,通过jieba分词、Word2vec词语向量化等方法来处理非结构化的文本数据。作为深度学习中BI-LSTM模型的输入向量,对生鲜水果类商品的在线评价进行情感量化分析,弥补了现有文献用评论评分来代表文本的情感极性的不足,并将情感分析结果作为预测评论有用性的特征之一。最终实验结果的准确率达到了85.63%,相比单向LSTM模型准确率得到了进一步的提高。且本文采用产品属性对应文本主题的方法,通过主题概率模型LDA对生鲜在线评论进行主题聚类,最终确定了“服务”、“物流”、“口感”、“价格”、“个头”五个维度属性,同样将其作为预测评论有用性的关键因素。
在情感分析和主题聚类的基础上,本文根据已有研究结果结合生鲜产品的特点,将购买-评价时间差作为生鲜产品的新鲜度,且加入情感极性、主题-属性特征,构建了生鲜在线评论有用性指标体系。通过RandomForest模型对评论有用性进行预测研究,设置对比实验,得出结论如下:生鲜评论文本情感极性与评论有用性呈非对称的“U”形关系;并且生鲜产品的5个属性对有用性影响的大小关系是:口感>物流>个头>服务>价格,体验型主题特征比如“口感”、“物流”对评论有用性的影响总体上大于搜索性主题特征比如“价格”;以购买-评论的时间差来代表生鲜产品新鲜度,在5天之内,其对评论有用性的影响显著,一旦超过期限,其影响可忽略不计。
本文在已有研究的基础上,构建了生鲜在线评论的情感分析和有用性预测模型,以期能够帮助潜在用户从海量在线评论中寻找真正有价值的信息和指导生鲜产品网店经营者更好地满足顾客的需求。
本文将在线评论情感分析和有用性的研究拓展至生鲜电商领域,利用爬虫技术获取生鲜商品在线评论文本的真实数据集,通过jieba分词、Word2vec词语向量化等方法来处理非结构化的文本数据。作为深度学习中BI-LSTM模型的输入向量,对生鲜水果类商品的在线评价进行情感量化分析,弥补了现有文献用评论评分来代表文本的情感极性的不足,并将情感分析结果作为预测评论有用性的特征之一。最终实验结果的准确率达到了85.63%,相比单向LSTM模型准确率得到了进一步的提高。且本文采用产品属性对应文本主题的方法,通过主题概率模型LDA对生鲜在线评论进行主题聚类,最终确定了“服务”、“物流”、“口感”、“价格”、“个头”五个维度属性,同样将其作为预测评论有用性的关键因素。
在情感分析和主题聚类的基础上,本文根据已有研究结果结合生鲜产品的特点,将购买-评价时间差作为生鲜产品的新鲜度,且加入情感极性、主题-属性特征,构建了生鲜在线评论有用性指标体系。通过RandomForest模型对评论有用性进行预测研究,设置对比实验,得出结论如下:生鲜评论文本情感极性与评论有用性呈非对称的“U”形关系;并且生鲜产品的5个属性对有用性影响的大小关系是:口感>物流>个头>服务>价格,体验型主题特征比如“口感”、“物流”对评论有用性的影响总体上大于搜索性主题特征比如“价格”;以购买-评论的时间差来代表生鲜产品新鲜度,在5天之内,其对评论有用性的影响显著,一旦超过期限,其影响可忽略不计。
本文在已有研究的基础上,构建了生鲜在线评论的情感分析和有用性预测模型,以期能够帮助潜在用户从海量在线评论中寻找真正有价值的信息和指导生鲜产品网店经营者更好地满足顾客的需求。