【摘 要】
:
推荐系统在电子商务和服务型移动终端的应用越来越广泛,使得人们的生活越来越便利。在电子商务网站或论坛中,存在大量蕴含用户对项目某些方面的相关评论,若将这些评论进行细粒度情感分析,既可作为可解释推荐系统中用户对项目评分的依据,又可给出推荐结果的解释原因,从而帮助用户更好地理解推荐结果,提升用户的满意度。因此,本文以项目评论数据为研究对象,通过分析评论中多个对象的细粒度方面项情感极性,进而基于用户在方面
论文部分内容阅读
推荐系统在电子商务和服务型移动终端的应用越来越广泛,使得人们的生活越来越便利。在电子商务网站或论坛中,存在大量蕴含用户对项目某些方面的相关评论,若将这些评论进行细粒度情感分析,既可作为可解释推荐系统中用户对项目评分的依据,又可给出推荐结果的解释原因,从而帮助用户更好地理解推荐结果,提升用户的满意度。因此,本文以项目评论数据为研究对象,通过分析评论中多个对象的细粒度方面项情感极性,进而基于用户在方面项的兴趣偏好以及项目在方面项的项目特性,建模用户和项目的表示,实现用户对项目的评分预测,并设计和实现一个基于方面项情感分析的可解释汽车推荐系统。主要研究内容如下:(1)融合细粒度表示的多对象方面项情感分类。利用评论中多对象的细粒度方面项标签,建模对象在细粒度方面项的情感特性。首先,对评论句子、评论对象以及描述对象的方面项多种粒度进行初始化向量表示,并将它们的表示进行融合,建立融合细粒度的文本初始化表示。其次,利用LSTM学习文本的潜在特征,融合文本中对象和方面的语义,并基于注意力机制实现文本的细粒度语义增强表示。最后,将文本细粒度语义增强表示与对象和方面的表示分别结合,并进行拼接,实现多对象的方面项情感分类任务。在COAE2015公开数据集上进行实验,验证了所提方法的有效性。(2)基于方面项的可解释推荐方法。文本中的方面项信息能够提升推荐系统评分预测的准确性,并给出细粒度的解释。考虑到方面项细粒度语义表示,本文提出了基于方面项的可解释推荐方法。首先,对于文本评论数据,使用word2vector和BERT获取文本评论的特征表示和方面的特征表示。其次,通过注意力机制学习用户在细粒度的多个方面的语义表示,并加权计算了细粒度的用户偏好语义表示;同时,以同样的方式学习了项目特性的语义表示。最后,利用用户和项目的表示,预测了用户对项目的评分偏好。在Yelp和COAE2015公开数据集上进行实验,实验结果表明该方法优于对比方法。(3)基于方面项情感分析的汽车推荐系统设计与实现。利用细粒度语义增强表示的方面项情感分类和基于方面项的可解释推荐方法,设计并实现基于方面项情感分析的可解释汽车推荐系统。该系统利用了用户文本评论建模项目的特性,并对目标项目的方面特性进行了说明,根据用户的偏好和项目的特性实现了细粒度方面项的推荐,并对推荐结果进行了解释。本系统界面友好,功能明确,使用方便。
其他文献
中西方绘画是世界历史文明发展史上重要的文化作品形式之一。在历史进程中出现了许多优秀的绘画作品,这些优秀作品是研究历史、文化、艺术和科技的重要载体。随着互联网技术数字化的日益普及,越来越多的绘画艺术作品被录入电子图书馆,艺术爱好者欣赏优秀的绘画作品变得更加容易。逐渐增加的数字绘画图像为学者们带来丰富的研究资源,同时,如何将大规模的数字绘画图像进行有效分类,是目前亟需解决的热点问题之一。绘画作品与普通
近年来,机器阅读理解研究受到国内外自然语言处理领域学者的广泛关注,已成为评价基于自然语言理解的智能系统的核心任务之一。2015年,国家科技部启动“语言问题求解和答案生成关键技术及系统”项目,其主要目标是研制出能够参加我国高考的智能答题机器人,并提升机器对自然语言的理解能力。在该项目的推动下,面向真实高考阅读理解试题的自动答题研究成为近年来机器阅读理解任务中的又一挑战。深度学习方法已被证明是机器阅读
机器阅读理解是近年来自然语言处理一个热门研究领域,本文聚焦高考语文文意理解多选题,该题型考查的是对文章局部信息、主旨、作者意图和态度的把握,文意理解的选项复杂多变,主要测试机器对文章语义关系、散文结构、写作技巧、篇章主题和作者情感等内容的理解能力以及对文章整体的把握能力,挑战极大。本文首先分析选择题与选项特点,其次将选择题答题技术分为两种,一种是基于两段式的阅读理解答题技术,一种是基于联合训练的端
2018年教育部新课标方案提出人工智能进课堂,将编程技术纳入高考范围,编程地位直线上升。在国家的号召下,现在很多中小学都非常重视学生编程能力的培养,所以开发一个编程教学管理与资源推荐系统对学校高效的开展编程课程是非常有必要的。目前中小学程序设计等课程存在的主要问题有:学生上机练习机会较少,缺少便捷高效的编译环境;教师与学生之间课堂沟通不足;学生自学时,面对种类繁多、数量庞大的学习资源,难以选择。编
随着智慧司法服务的快速发展和广泛应用,对司法文书的分析与挖掘已引起越来越多的关注,命名实体识别(NER)作为司法领域研究中的一项基础性任务,它能为司法知识图谱构建、法律判决预测和机器阅读理解等一系列的研究工作提供重要的知识。命名实体识别旨在识别出文书数据中的实体指称项,并标明其实体类别。近年来,许多命名实体识别的研究工作均基于深度学习、神经网络模型等,但专门针对司法领域实体识别的研究还相对较少。目
大数据时代,实际应用领域搜集到的数据往往呈现出更多复杂特性,作为一种较多见的数据形式,区间型数据在金融、气象、农业等诸多领域广泛存在。尽管对于区间型数据的表示、分析、挖掘已有一些研究,但大多数研究都是针对静态区间型数据,对于实际应用中随时间不断更新的动态区间流数据,目前的研究还相对较少。由于区间流数据所具有的时序特征,传统静态区间型数据的分析挖掘方法往往不能直接使用。针对这个问题,本文提出一种基于
随着现代信息技术和移动互联网的发展,信息量以惊人的速度产生和传播,面对数不胜数的信息量,人们难以在短时间内筛选出有用信息。为了帮助用户在节省时间的同时寻找到有用信息,推荐系统应运而生,并得到迅速发展。传统推荐算法通常认为用户兴趣随时间推移是稳定不变的,然而,在真实场景中,随着时间的变化,用户兴趣偏好不断发生改变,新产品的出现、季节的交替、流行趋势的变化等均会影响用户的选择。因此,如何从历史行为数据
随着“互联网+”在教育领域的不断渗透,在线学习平台丰富的学习资源为人们获取信息提供了新的契机。但学习资源的多样性和广泛性导致数据呈指数级增长,致使平台用户难以获取满足自身需求的资源。为了追求平台的用户访问量和学习资源点击量,个性化学习资源推荐算法应运而生。它可根据学习者的行为日志挖掘和推送满足自身需求的学习资源,从而达到“个性化推荐”的目的。然而随着在线学习平台数据海量聚集,资源过度膨胀,传统推荐
孤立点检测作为大数据研究中的一项重要技术,在网络监测、电信和信用卡欺诈、金融证券服务等各大应用领域中都发挥着巨大的作用。孤立点检测的目的在于找出一个数据集中与大多数对象行为显著不同的一部分对象。在众多的孤立点检测方法中,基于聚类的方法因其不需要预先知道数据集的分布和参数少等特点而脱颖而出。但是目前基于聚类的孤立点检测方法中,一部分方法仅通过优化聚类算法来提升孤立点检测的效果,另一部分仅聚焦于簇内孤
近年来,自然语言处理的重心已逐步从句法处理研究转移到语义分析研究中,语义知识库的构建至关重要。汉语框架语义知识库(CFN)已具有一定的规模,但词元库的低覆盖率问题比较严重。CFN现有动词6175个,与现代汉语词典中的17788个动词相差甚远。CFN词元库主要是通过翻译Frame Net已有词元构建的,不可能包含中文所有词语,故需要不断的扩充词元完善CFN词元库。当使用CFN在大规模真实文本中进行框