论文部分内容阅读
随着web2.0的快速发展,网络数据几何增长,快速、准确获取用户需求信息成为相关企业和客户的迫切需要,各种各样的产品推荐系统应运而生。传统推荐系统大多是以产品为中心,以用户评分为数据源,系统性能依赖于用户偏好模型的质量,但用户的偏好信息很难以简单的评分来全面表征。因此,推荐系统常出现冷启动、数据稀疏性等问题。为了解决这些难题。本文提出以在线评论为基础数据源,在对传统网络购物推荐系统以及在线评论挖掘相关理论、技术、方法等进行梳理、分析的基础上:首先,作为网络口碑的主要传播形式,在线评论在已有文献的研究中大都先验地被当作外生变量来处理,并将两者间的动态相互关系简单的看成静态单方向作用。本文在动态内生性假说的视角下,引入在线评论各属性变量外的可测量的控制变量与难以观测或度量的哑变量,研究消费者基于在线评论的产品网络口碑感知问题。在动态面板数据模型中,通过控制变量与哑变量控制住内生性的影响后发现:(1)在静态分析框架下,在线评论与网络口碑感知之间是相互影响的,哑变量会对网络口碑感知与在线评论之间同时产生影响;(2)在动态分析框架下,在线评论与网络口碑感知之间存在一定的跨期作用,但滞后期并不确定,并且负面在线评论的比例与网络口碑感知之间并没有本文预期的反馈效应,这说明,二者的跨期动态作用并不是相互的而是单方向的。通过分析网络口碑感知的影响因素,确定在线评论的各属性对消费者网络口碑感知的不同影响,识别关键因素,为在线评论信息的差异化挖掘提供依据。其次,在以上分析的基础上,重点研究了在线评论的挖掘,包括在线评论数据源的挖掘以及在线评论信息的挖掘两部分。不同于以往的在线评论分析数据直接取自网络购物平台或专业点评网站,本研究将整个互联网作为在线评论的数据源,并从中挖掘可靠的数据源。通过将研究分解成三个子任务,对网络数据从运用改进的PageRank剔除作弊网页开始;再运用改进的TC-PageRank提炼与产品主题高度相关并包含大量在线评论数据的网页集;到运用改进的HITS确定在线评论分析数据来源的权威网页集结束。而对于在线评论信息的挖掘研究,在线评论作为潜在消费者网购的重要参考依据,挖掘其有价值的信息是有效利用的关键。针对网购平台的设计原则以及消费者的实际需求,融合社会化标注构建领域本体,基于领域本体的层次结构,将在线评论的特征词映射为本体概念,并利用Jess推理引擎提取评论中的隐性产品属性,再将概念间的层次关系映射到产品属性中,构建层次化产品属性集。基于层叠CRFs模型以及情感词典,从在线评论的极性分析到句子级的情感强度分析再到产品属性级的褒贬强度分析,实现在线评论情感倾向性的层次化分析。最后,针对网络购物推荐系统的数据稀疏性、冷启动问题日益突出以及传统的基于评分信息的用户偏好信息采集的不足,导致推荐算法的推荐效果不能令用户满意的问题,本文在上述网络口碑感知影响因素分析的基础上,提出了基于在线评论信息挖掘的用户偏好模型以及产品特征模型的构建方法。基于层次化的用户偏好信息,构建了基于本体建模方法的动态用户偏好模型,并通过用户偏好的更新本体进行用户偏好的增加、删减以及调整,时刻保持用户偏好本体的动态更新。在构建网络购物混合推荐模型之前,研究如何设计推荐系统才能获得用户的信任,进而实现推荐系统的预期作用。利用管理学、心理学、信息学等相关理论和方法,基于人际信任理论将用户对推荐系统的信任过程划分为从初始信任到交互信任再到推荐信任的三个阶段。探讨了影响各阶段信任的关键影响因素,并构建了多阶段用户信任的综合模型。基于该研究分析了用户信任及采纳推荐系统的关键影响因素,得出用户感知可信并采纳的推荐系统特征。在实证研究的基础上,根据Walls等提出的ISDT框架,分别从元需求与元设计两个方面对用户感知可信并采纳的推荐系统特征进行了详细阐述。根据上述研究结果,构建了基于在线评论挖掘的网络购物混合推荐模型,将推荐细化到产品特征层次并按消费者对产品的各特征评价进行综合排序。该模型以协同过滤算法为框架,结合基于内容推荐算法,通过产品的多属性评分来缓解稀疏性问题,并通过基于用户属性的相似度与基于产品属性的相似度计算算法在一定程度上解决了用户冷启动与产品冷启动问题;结合多种相似度算法构建了基于用户偏好与产品特征的混合推荐算法。仿真实验通过采集淘宝网、亚马逊中国网、京东网这三个国内大型网络购物平台的手机频道的10000条在线评论信息,验证了基于在线评论挖掘的网络购物混合推荐模型良好的推荐精确度以及解决冷启动问题的能力。并基于上述的研究结果,探讨了网络购物推荐系统的推荐策略以及网购平台在产品营销的管理实践中的主要对策建议。结合全文研究,总结归纳本文主要研究内容与贡献,并阐述本文不足之处以及对后续研究的展望。