基于评论挖掘的商品导购方法的研究与实现

被引量 : 0次 | 上传用户:wang3993
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的广泛使用和电子商务的迅猛发展,用户在购买和使用产品后会在互联网上发表对产品的评论,这些评论中包含了用户对产品性能、外观等方面的态度。越来越多的人在做出消费决策前喜欢先到互联网上参考用户对某产品的评论。但是互联网上的信息数量巨大,全部阅读这些评论来帮助做出决策十分困难,挖掘产品评论对于商家和潜在的消费者都有着重要的意义,所以评论挖掘是一个亟待研究的课题。本文利用关联规则CBA方法识别出频繁项作为产品特征候选集合,通过剪枝和相似度计算来调整候选产品特征集合,实现网络评论产品特征的识别。针对观点挖掘,本文构建了用于产品评论情感分类的特征领域情感词词典,同时提出一种适用于主语已知情况的观点挖掘算法RSBV,然后采用监督学习中的支持向量机分类方法对评论中涉及商品特征的观点进行分类研究。情感分类结束后,利用分类结果进行特征的优缺点汇总,形成优缺点的长、短摘要,并针对客户的特征要求,根据情感分类结果进行商品的推荐价值计算。最后对KDD2012中提出的代表性评论集挖掘算法进行研究,对其中的适用于大规模数据的迭代随机算法进行分析和改进,提出了一种新的代表性评论子集挖掘算法CLRS,该算法能在某一商品的所有评论中搜索一组综合性评论集,极大化代表所有评论的意义,从而进行信息反馈。本文以中文产品评论为主要研究对象,实现对评论中产品特征层面的观点进行挖掘和情感分析,利用本文提出的RSBV算法,并通过构建特征词词典和特征领域情感词词典,提高了观点挖掘的准确性。形成特征的长短摘要,使得信息简洁明了。设计了商品推荐价值函数,根据用户要求进行商品推荐价值计算,实现商品推荐功能。最后我们提出了CLRS算法进行代表性评论子集的挖掘,实验结果表明该算法的高效性和准确性。
其他文献
高校电子档案信息管理系统是实施高校档案信息化的关键点之一,是高校信息化建设的一个重要组成部分。高校电子档案信息对高校的发展有着至关重要的作用,为了使电子档案信息管理
为充分发挥大型仪器设备在本科实验教学环节中的作用,培养和锻炼学生严谨的科学作风,该文通过引入OBE工程教育模式,探索以学习产出为导向的开放实验。结合机械设计制造及其自
数据分析显示,近年来中国社会结构虽然出现了一些群体地位上升的现象,但是,下层比较巨大、中产阶层比较弱小还是社会结构的基本特征。中国中产阶层的扩大主要有三条渠道,即教
文章提出一种深化调峰的私家车/出租车群组合优化充放电策略,该策略采用蒙特卡洛模拟法模拟私家车、出租车和公交车3种类型电动汽车充电负荷,分析不同类型电动汽车对电网负荷
清代船舶与港埠题材西洋画是东西方经济文化交流的产物。它的出现具有重要的意义。首先,它的出现,标志着清代中西方经济交流过渡到文化交流的过程。其次,船舶与港埠题材西洋
空中乘务员作为一种独立的职业,其存在由来已久。近年来,随着民用航空业的发展,其队伍也逐渐壮大,空中乘务员人身权利保护也遇到了前所未有的挑战,空中乘务员在工作中遭遇人身权利
数字时代,快速发展的技术特别是渗入在我们社会生活的方方面面的计算机网络技术重组了我们思维、交流和生活方式,人们的学习方式以前相比发生了许多重要变化:知识的半衰期从几
目的咳嗽变异性哮喘是一种特殊类型的支气管哮喘,儿童年龄不分大小,咳嗽是其主要甚至唯一的临床表现。咳嗽持续或反复发作大于1月,夜间或清晨发作,为刺激性干咳,病毒感染、接触冷
坡面是地表过程发生发展的基础单元,是流域最基本的组成单元,同时也是土壤侵蚀的主要发生地和沟道泥沙的主要来源区。本文基于北京山区坡面径流场以及首都圈森林生态站的定位
自教育部发布《基础教育课程改革纲要(试行)》以来,中学基础教育就有了其自身改革目标,即要改革课程内容偏重书本知识的现状,加强课程与学生生活以及现代社会的联系,关注学生