论文部分内容阅读
随着网络的普及,电子商务得到了迅猛的发展,同时也出现了各种各样的商品推荐系统。已有的推荐系统大多是以商品为中心,通过用户的浏览历史对用户进行推荐更多的商品。这样的推荐系统在许多情况下是有用的,可以为我们提供对自己有用但是自己不了解的商品。但是用户购买商品往往会带有一定的目的和偏好性,如果购买到不符合自己期望的商品就会大大降低购物体验。因此,为了使用户直接可以买到最称心如意的商品,我们使用了基于评论分析的技术,通过挖掘评论中的有用信息对用户进行相应的推荐。本文的主要贡献点如下:第一,获取显式评价对象。现有的典型方法是构建以形容词短语和名词短语为基础搭配的语法模式,本文通过对大量评论进行句法分析,在常用汉语语法模式下,增加了动词短语形式的语法模式,从而可以对显式评价对象和相应的评价词进行更有效的抽取。第二,获取隐式评价对象。现有的研究均聚焦于显式评价对象的抽取,往往忽略了隐式评价对象抽取的研究,但现实中往往存在大量无显式评价对象的评论(即只含有评价短语而未写明评价对象),对于这一问题,本文对特定领域产品评论进行分析,建立了从评价词到相应评价对象的映射集合,这样,对于只有评价词的评论短句可以自动获取相应的评价对象。第三,规范商品属性的情感倾向识别流程并细化识别结果。现有的研究通常是分别计算出每个评价对象的评价倾向,这样就会存在过多的评价结果,从而未能使用户得到清晰明确的结果,本文在计算出评价词的极性值后,又构建了商品属性词典和对应的产品特征树,将每个商品属性的不规范表达和子属性规约为规范化的大属性,并使用聚类算法对商品的每个属性进行聚类,最后得到评论中每个属性的用户满意度区间,即将其聚类为非常好,不错,一般,差,很差五个大类,并显示出每个大类所占的比例,从而提供给用户一个非常清晰的结果。第四,对评论分析的主要步骤进行了实验的验证,证明本文所用方法的合理性和有效性,最后设计了最终的推荐系统。用户可以给出所关心的商品属性的优先级,系统利用前面章节介绍的评论分析处理技术,并结合多属性决策算法给用户提供较优的商品排序结果。同时,用户也可以查看此结果中比较感兴趣的商品评价情况。本文所提供的商品推荐系统是一个原型系统,目前只针对手机这一特定领域,用户通过使用本文的推荐系统,可以得到满足自身特定需求的的商品,具有很大的应用价值。