论文部分内容阅读
电子商务迅速发展,消费者开始热衷于网上购物和发表评论,这些评论为店家、生产厂家以及潜在的消费者提供了重要的参考信息。然而评论有可能是虚假的,虚假评论的存在在一定程度上会影响评论的参考价值,因此识别出虚假的电商评论显得极为重要。本文主要针对电商评论,围绕评论显式特征、隐含特征以及显式特征和隐含特征结合的方式展开研究,主要完成了以下研究工作:(1)针对目前虚假评论识别都是通过评论者或评论文本的显式特征来进行的,但是没有考虑评论文本的语义信息,分析结果不够准确,因此提出基于隐含语义分析的电商虚假评论识别方法。该方法在基于用户行为特征分析的基础上增加了评论文本的语义分析信息,使得能在文本语义层次上识别虚假评论,提升了识别准确性。(2)利用依存句法分析评论文本,提取出评论中的属性值对,然后通过依存关系、词性规则和词典三种方法进一步过滤得到更有参考价值的特征值对。特征值对的多少是识别虚假评论的重要参考项。(3)使用错位级别的方法来评估实验结果。由于实验方法的特殊性,不便于使用传统的的评估方法,因此本文使用了错位级别的评估方法。(4)最后设计并实现了电商评论分析系统,为进一步分析评论及研究虚假评论的识别方法提供便利。