基于网络评论挖掘的商品综合评分模型研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:y317145569
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网成为中国网民购物的一个重要渠道,网络评论也充斥着每个购物平台,网络产品评论所提供的信息也影响着消费者的购物行为。由于网络产品评论的数据量非常巨大,并且其中掺杂着很多无意义的,甚至恶意的垃圾评论,对于用户来说浏览如此庞大数量的评论会浪费时间,且获取到的信息不一定完全真实可靠。分析目前各大主流购物网站的现状,发现目前网站普遍采用五分制的评分来直观展示消费者对产品的打分,这种评分和评论内容独立的情况导致用户不仅要看评分还要看评论内容才能确定评论所表达的准确信息。鉴于上述一系列的复杂现状,本文基于网络评论挖掘,并结合垃圾评论识别研究如何构建一个商品综合评分模型。本文研究的最终结果是构建一个商品综合评分模型,其中最主要的过程是评论内容的情感分析。评论内容情感分析中首先通过分词系统进行评论的预处理,利用Apriori算法和剪枝方法提取特征词。然后结合HowNet和《同义词词林》扩充极性词数量,并且参照《中文情感词汇本体库》对极性词进行情感强度的标注,完善极性词词典内容。最后利用隶属度方法提取特征-观点词对,并分析程度副词和否定词对观点词的影响,计算的评论内容情感值有效反应了评论者的情感。并且在评论内容情感分析的基础上,本文提出融合评论者行为和评论内容的垃圾评论识别方法,分析了进行垃圾识别的评论者行为和评论内容特征,并采用KNN分类器有效地对评论进行是否为垃圾评论的分类。最终的模型构建综合考虑评分、评论者专业能力、评论内容的情感值、评论归属(是否为垃圾评论)四个因素,模型有两部分组成:单条评论的评分模型、商品的评分模型。最后给出实验,实验数据来自数据堂提供的两款手机和一款笔记本的评论数据。本文分别对产品特征词提取、特征-观点词对提取、评论内容情感分析、垃圾评论识别和综合评分模型进行实验,并对结果进行分析,实验结果表明,本文在构建模型中提出的方法具有合理性和有效性。
其他文献
农业供给侧结构性改革是“三农”领域的一场深刻变革,随着农业供给侧结构性改革深入推进,我国农业的确出现了良好的发展势头,2016年12月份,我国政府明确提出2017年将要深化推进
近年来,中国电子商务如雨后春笋般的迅猛发展,逐渐引起学术界和企业实践人员的广泛注意,纷纷把传统营销理论应用到网络购物市场中,其中一些理论成功适用,同时一些新的理论与
在造纸及纸加工行业使用的粘合剂品种较多,有天然粘合剂和合成粘合剂。根据所要求的粘着强度和各种胶粘剂的适用性、所成膜的性能及其对涂层总体性能的影响,人们往往将几种胶粘
项目群管理是为实现组织战略目标,对多个存在内部联系的项目进行组织、目标、资源和质量等要素的集成化管理,以实现项目资源的优化配置和管理效率的提升,从而最大限度的实现
中国国际工程承包业历经半个多世纪的发展,实现了巨大提升。从起初仅能实施经济援助项目、开展劳务输出和分包,发展到如今能独立进行施工总承包等多种形式,进入的市场也已从
近年来,随着电子商务的迅猛发展,越来越多的人喜欢在网上进行购物,网络购物已成为一种大众的消费形式。然而,电子商务网站中用户数目和商品数量也在不断的增加,信息资源不断
<正>莫里哀最早提出吃是为了活着,还是活着是为了吃这个命题。吃是个每天都要面对的问题,而且每天都有三次机会,这在人的一生中可是个很大的比例。
随着我国社会经济的不断发展,土木工程的发展取得了瞩目的成就,成为了国民发展的支柱产业.比如在迎接西部大开发的阶段,甘肃省集中力量在加强基础设施建设中,大兴土木工程建
以苯乙烯–丙烯腈–马来酸酐三元无规共聚物(SAM)为增容剂,研究了丙烯腈–丁二烯–苯乙烯塑料(ABS)含量、SAM和BlendexBMAT消光剂对聚酰胺6(PA6)/ABS合金光泽度和力学性能的
古语有言:水之有源,树之有根。源不厌开掘,终得其丰;根不倦伸展,故成其深。源丰方可水长,奔流不息;根深才能树荣,郁郁葱葱。由此可知,万事皆可循其源,万物皆能觅其根。为师者
期刊