论文部分内容阅读
随着电子商务的迅速发展,网上购物逐渐发展成为人们购物的主要方式。由于网上购物中的消费者与电商平台商家信息不对称的特点,在网上购物的过程中,电商平台中的商品评论信息逐渐成为消费者网购决策的主要依据。但是,由于利益的驱使,越来越多的商品虚假评论信息出现在消费者面前,并且由于网络水军、网络职业写手的存在使得商品的虚假评论与真实评论的区分难度越来越大,使得消费者不能直观的获取到买家对商品购买体验与使用体验的反馈信息,因此商品虚假评论检测研究随之展开。随着研究者的不断努力,越来越多的虚假评论检测方法被提出来。然而面对当今虚假评论具有很高仿真性的特点,当前的虚假评论检测方法慢慢暴露出局限性:基于评论内容特征的检测的传统机器学习方法,对于自然语言处理领域,语言特征的提取对于领域知识具有很强的依赖性,算法识别能力较差,泛化能力较弱,误判率较高;人为虚假评论具有很高的仿真性,单纯从评论内容这一维度特征构建模型对虚假评论识别具有一定困难。针对以上问题,本文提出了一种基于深度学习的多维特征虚假评论检测模型。该模型使用深度学习中的双向长短时记忆网络模型(Bi-LSTM)来获取商品评论文本内容的上下文语义信息特征来取代传统机器学习中人工特征选择过程。同时加入评论内容自身特征、评论者行为相关特征、商家行为相关特征并使用卷积神经网络(CNN)通过不同步长的卷积核(filter)进行特征组合来帮助区分仿真性很高的难以识别的虚假评论。最后本文将注意力机制(Attention Mechanism)加入到基于深度学习的虚假评论检测模型中来调整多维特征对最终分类结果的影响权重,提高模型检测的准确率与召回率,同时注意力机制可以对特征权重高可视化输出展示,提高用户对虚假评论识别的置信度。