论文部分内容阅读
随着B2C电子商务的发展,网上商品的数量和种类越来越多,商品信息也越来越详细,但是商家和消费者之间的信息不对称问题仍然存在,并会对商品交易和消费者满意度产生消极影响。Web2.0的兴起为商家和消费者提供了更为便利的沟通方式,通过B2C网站的各种交互平台,商家可以获取用户反馈的各类信息,有针对性的对网站商品详细信息进行完善。本文首先对电子商务中信息不对称问题进行了阐述,分析了B2C网站常见的各类交互方式,认为商家可以通过收集用户反馈信息发掘用户关注的商品属性;然后结合文献,介绍了目前国内外商品属性抽取的相关算法研究,对商品属性抽取进行任务划分,提出了本文的商品属性抽取流程和基于关联规则的商品属性抽取方法,该方法主要包括数据预处理、构建关联规则事务文件、应用关联规则算法抽取频繁项集、初始商品属性集合后续处理等四个部分;对于提出的商品属性抽取方法本文也进行了实验验证,对B2C网站中获取到的实际用户数据进行实验,从查全率和查准率两个角度对本算法进行了实验结果分析和讨论,实验结果证明了该方法的有效性,但同时也发现了本方法仍存在的缺陷,如分词工具和产品所属类别对本方法的性能存在着较大的影响。最后,指出了本研究的问题和不足,以及后续研究可能发展的方向。