论文部分内容阅读
手机等智能终端设备的快速普及给用户提供了快捷的信息传播渠道,使得互联网信息的产生方式从Web2.0时代以网站雇员为主转变为现在以用户为主。得益于信息传播的便捷性,网络购物已成为多数人生活的一部分。在网购过程中,电商网站的在线评论系统和问答系统为消费者提供了信息互动平台:用户可以在评论系统上描述自己的购物体验,也可以通过在线问答系统向商家或其他用户咨询某一款商品的相关信息。分析并挖掘上述用户产生的评论中的潜在信息并利用这些信息设计智能回复、即时推荐等互动功能可以有效提升用户的体验和购物效率。但上述互动平台产生的文本数据与政府新闻等正式文体不同,这种消费者在购物前后所产生的评论文本带有强烈的个人主观情感取向。因此,面向评论的情感分析就成为了评论文本智能理解的基石。其中,面向商品评论的情感极性识别是情感分析的核心问题。深度学习方法近年来在文本情感分类问题上表现优秀,但缺乏大规模高质量的标注数据是其瓶颈问题。为解决该问题,本文提出了一种弱监督深度学习方法,利用用户评分作为弱标注数据来预训练深度模型,再利用少量标注数据微调整个模型的参数。实验表明该方法在商品评论数据的情感分类任务上表现优秀。在文本的情感分析基础之上,为了进一步提升用户的购物效率,本文提出了一种基于用户提问的快速回复算法。传统在线问答系统存在即时性差的问题,用户提问之后仍需要耐心等待他人的回复。而已有商品评论则是一个巨大的信息宝库,从中可以找寻问题的答案。基于这种思考,本文提出了一种多任务深度模型来解决面向商品评论的智能问答问题。该模型利用在线问答系统中已有的问答数据来辅助学习问题与相关评论语句之间的映射关系。此外,提问中还暗含用户的购买需求信息,根据购买需求向提问用户进行即时推荐可以有效提升用户的购物体验,同时还能刺激消费从而满足商家对利益诉求。基于这种思考,本文提出了一种新颖的推荐问题:用户提问驱动的商品推荐。为解决该问题,本文设计了一种问题驱动的注意力神经网络来预测用户的购买倾向。该方法分析用户提问中的即时性需求和用户历史评论中的个人偏好来预测用户的购买倾向,进而推荐合适的产品。综上所述,本文的主要创新点如下:(1)面向商品评论的情感极性识别任务,提出了一种弱监督深度学习方法。该方法利用评论的评分作为弱监督信号来预训练模型,再利用少量标注数据来微调整个模型的参数。本文设计了一种抗噪声的三元准则来减小弱标注数据中的噪声数据对模型训练过程的影响。(2)面向商品评论的智能问答任务,提出了一种基于多任务学习的注意力模型。该模型利用电商网站在线问答系统中已有的问答数据来辅助学习问题与相关评论语句之间的映射关系。在模型的训练策略方面,本文提出了一种结合主任务先验知识的部分共享式迁移学习策略来实现任务之间的知识迁移。(3)面向问题驱动的商品推荐任务,提出了一种问题驱动的注意力神经网络来预测用户的购买倾向。该网络利用用户提问中的即时性需求及其历史评论中的个人偏好来分析用户的购买行为。商品评论中的相关性信息和正面情感极性信息是支撑用户购买行为的基本要素。所采用的注意力机制可以从评论中寻找到推荐理由。最后,本文综合用户的购买倾向和推荐理由实现了解释性推荐。文本在亚马逊公开数据集和淘宝数据集上评估了上述方法。结果证明了本文所提出的方法在相应的文本智能理解任务上的有效性和超出同类算法的优越性。