基于商品特征挖掘的在线评论有用性分类研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:dpf443398
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的快速发展,越来越多的消费者习惯于网上购物。消费者在发生购买行为后,可以对己购买的商品进行评论,这些评论不仅是消费者对商品卖家的反馈,同时也能对其他消费者提供建议和指导。商品的热销意味着商品评论的大量增加,某些火爆的商品动辄数万条的评论让卖家和买家都难以处理,这就需要双方从海量的商品评论中快速地筛选出有用的评论,从大量冗余的信息中提取出真正可以指导销售和购买的有用信息。对海量在线评论中有用信息的迫切需求使得国内外研究者都不约而同地关注起了评论挖掘的一个具体的应用领域——评论有用性分类。本研究考虑到各大电商网站普遍无法提供全面的评论信息这一现实情况,从评论内容本身及商品特征信息入手,通过商品特征挖掘为评论有用性分类特征的选取提供参考;为了充分利用海量的评论,本研究采用半监督学习的方法对分类模型进行训练,最终得到有优异性能的评论有用性分类模型。论文首先研究已有商品特征挖掘方法的不足,从分词、剪枝和特征选取等方面进行有效改进,最后得到优化的商品特征挖掘结果;在此基础上,深入研究评论有用性的影响因素,将商品特征信息作为一个重要参考因素加入到有用性分类特征集合中;最后利用支持向量机的重要扩展——直推式支持向量机进行半监督学习,综合利用有标签评论和无标签评论,训练出在线评论有用性的半监督分类模型。结果显示该分类模型表现优于传统的监督学习模型,在只考虑评论内容信息条件下有较好的表现,进而说明商品特征信息是影响评论有用性的重要因素,而半监督学习可以有效地提升分类结果。
其他文献
全面放开二孩生育政策后,农村仍是我国计划生育工作的难点所在。主要表现在:农村计划生育管理机构不健全,农村计划生育管理的难度增大;农村计划生育管理人员水平参差不齐,多
尽管肺癌的发病率逐年上升,但肺癌的治疗仍无突破性的进展,而治疗的毒副作用又给病人带来了许多痛苦,因此对于临床医生来说,肺癌病人的生活质量和生存时间都不容忽视。生活质
虾青素是一种从虾蟹外壳、牡蛎、鲑鱼及藻类、真菌中发现的红色类胡萝卜素,具有极强的抗氧化活性,它能够有效地清除体内的自由基和活性氧,在疾病预防和治疗中起着重要作用。
<正>根据软件管理工具包制造商OPSWAT最近发布的全球杀毒软件市场占有率报告显示,全球前三名杀毒产品都是可以免费下载的。这并不奇怪,因为这些免费版本主要都是用户和小型企
为了精准地获取微博领域权威性用户排序列表,在现有研究成果的基础上以新浪微博为研究对象,手动构建领域词典,面向微博领域提出了领域微博权威性用户度量模型(domains-microb
通过经济指标分析对联合站主要能耗构成、能耗监测管理、过程控制等方面进行阐述,确立了"高效低耗"节能原则:加强精细管理,强化节能意识,不断挖掘内部潜力,推进节能降耗工作
针对掌纹识别中图像预处理所带来的位置变换,一种有效的模板学习算法被应用于掌纹识别的特征提取。通过样本学习,利用参数估计的方法,每种掌纹模式的理想模型表示为小波域内
与过往相比,我国居民的人生追求和消费观念正在转变。一方面,随着国民收入水平以及国民受教育水平的普遍提升,人们对生活的质量要求越来越高,已经从过去单纯的温饱需求转变成
<正>同志们:今天,中国热带作物学会六届二次理事会、常务理事会暨学术研讨会在这里隆重召开了.在此,我代表四川省人民政府对会议的召开表示衷心的祝贺!对出席本次会议的国家
会议
21世纪“海上丝绸之路”的战略布局加强了中国与新丝绸之路上各个国家的合作与交流,其中备受瞩目的是CAFTA的进一步深化和发展。双边的贸易在之前签订的合作框架下获得了前所