论文部分内容阅读
随着互联网技术的应用与普及,在线购物方式的优势突显,逐渐成为一种新型的购物形式,在线商品评论的数量也随之激增。而网上购物的方式由于存在这信息不对称的特点,仅由卖家发布的商品信息不能为消费者提供充分的判断,这促使大部分消费者在做出购物决策前会阅读之前消费者的评论,以此来降低购物风险。正因为消费者的此种行为模式,许多商家和用户在本身利益的驱使下发布了大批量的虚假评论,以此来误导潜在消费者,提升自身商品的销量,严重危害了在线购物环境和秩序。这些虚假评论具有专业性和刻意性,对于普通的消费者无法轻易识别。因此,需要设计出一种技术帮助消费者识别虚假评论。卷积神经网络(Convolutional Neural Network, CNN )由生物的自然视觉认知机制启发而来,是一种经典的神经网络。卷积神经网络可以直接通过训练数据进行学习,把原始数据通过一些简单的模型转变成更高层次的、更加抽象的表达。本文针对虚假评论文本分类识别过程中难以提取有价值的特征问题,对现有的分类算法进行分析和总结,设计了一种增加主题倾向的Subject2Vec文本表示方法,提出了动态特征值过滤策略,在此基础上设计了主题-动态卷积神经网络识别算法,并通过实验对比证明其识别能力的提高。另外,基于主题-动态卷积神经网络识别算法,借助JavaScript、HTML等web技术搭建了一个在线商品评论真假判别系统。本文通过结合应用的具体场景对文本分类提出新的思路,使用改进的卷积神经网络优化了识别算法的特征提取能力,提高了虚假评论识别的准确性,也为同一类型问题的研究提供了新的思路。