基于多头注意力机制的电影推荐方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:Cary1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机和多媒体技术不断发展和成熟的今天,看电影也逐渐成为人们的日常娱乐活动,但互联网大数据的到来也同样带来了信息过载的问题,如何在数量和种类繁多的电影中找到用户所喜欢的,也是在推荐系统研究中的首要问题。电影推荐方面,传统的协同过滤推荐算法主要以用户对电影的评分作为推荐的依据,而用户和电影的其他多种特征数据,如用户的年龄、职业、爱好,电影的简介、评论等大多数重要的信息都没有充分利用起来,这样做的缺点是缺乏对用户行为偏好的精细定位。本文针对这样的问题提出了基于用户偏好学习的电影推荐模型CBLSC。此外,为了解决并行执行以及数据稀疏性问题,本文在CBLSC模型的基础之上,提出了基于自注意力机制的用户个性化电影推荐模型CBLAMF。通过不同模型的对比实验分析,表明本文提出的CBLAMF模型可以获得比其他方法更好的性能。本文详细的研究内容如下:(1)提出一种基于用户偏好学习的电影推荐CBLSC模型。该模型可以将单个电影的简介划分为多个句子,然后依次通过卷积层神经网络来提取特征表示,来充分理解电影简介的特征信息。接着再使用LSTM顺序地集成这些句子特征,来构建整个句子特征表示,这样就能结合电影简介中的上下文信息来抓取单词之间的细微差异,从而更准确的获取到电影简介中的关键信息。在得到了电影简介中的特征之后,最后再结合用户和电影的其他属性特征以及电影的评分信息来进行相似度计算,就可以得到为用户推荐的前N项电影的推荐结果。(2)提出一种结合自注意力机制用户偏好电影推荐模型CBLAMF。模型中融入多头注自意力机制的目的是进行多次缩放点积的并行计算,然后将相互独立的注意力计算单元拼接在一起,最后再通过一个线性单元转换成期望大小的维度输出。因此,CBLAMF模型可以通过自注意力机制来获得输入和输出的全局依赖关系,来学习输入序列的内部依赖关系,然后把这种依赖关系输入到每个多头自注意力机制层,同时结合上一次输出的信息来生成下一个特征表示。这也使得本文的模型能够自适应的结合上下文信息,从而更加精确的获取特征信息。此外,在计算得到特征输出之后,使用矩阵分解来计算出特征评分来为用户提供推荐,这样也很好的解决了数据稀疏性的问题。(3)实验结果和分析。基于推荐系统性能的评估标准,本文基于所提方法与其他电影推荐方法综合相比教,且具有较好的性能。
其他文献
近些年,环境污染事件的发生率逐年提高,迫切需要环境污染事件的快速监测,而传统的环境污染监控手段仍然存在监测技术配套性差和地区发展不平衡的问题,无法做到全区域、全时段、全种类的覆盖。网络新闻文本因具有广泛性、真实性和新鲜性的特点,往往可以弥补物理设备监测的不足。但是,环境污染事件往往存在“多米诺效应”,其新闻文本中易出现诸多干扰信息,如多个时间、地点和人物的混合表达,使得网络新闻文本蕴含环境污染事件
学位
学位
随着新浪微博、微信等社交媒体的崛起,互联网媒体及电子出版物代替了传统报纸等纸质出版物成为人们发布和获取信息的主要渠道。网络的飞速发展以及各种移动终端设备的流行促使网络电子文本信息的爆炸式增涨,如何从海量电子文本信息里快速汲取有效信息逐步成为研究热点问题,文本摘要自动生成技术正是解决这一问题的核心。文本摘要自动生成技术不仅仅可以提升获取信息的效率,更支撑了智能应答系统、网络舆论解析等上层应用的建设。
在实际学习与科研中,许多情况下需要将灰度图像渲染成彩色图像,例如将黑白照片着色、对夜视成像效果进行彩色化等等。现较为流行的灰度图像着色的方法是专业技术人员借助专业的图像处理软件如photoshop将图片分区,之后通过调整各个分区色相和色彩饱和度来完成上色,整个过程相当复杂。在计算机视觉领域,也有利用传统的数字图像处理技术如基于颜色传递、基于颜色标记等方法实现灰度图像着色,但是,该类技术往往需要处理
在汽车发动机性能开发中使用机器学习算法对发动机的经济与排放性能进行回归分析是不同于传统的技术手段,使用基于机理的数值预测模型能够实现最佳的预测精度,但是要想达到理想效果难度较大。而基于机器学习算法的回归预测方法能够降低技术难度,提供一种新的技术尝试。本文基于机器学习的多种算法对发动机的BSFC、NOx、HC、CO和CO2参数进行回归预测研究,使用遗传算法对回归预测模型进行超参数调整,优化模型预测表
地震波模拟是地球物理科学研究不可或缺的一部分。在地球物理学中,数值模拟揭示了一些物理场信息,这些物理场在测量时是不容易获取的,因此通过数值模拟可以更好地了解场的行为和地下结构。在进行地震波模拟计算时,对于较小的模型,可以使用单个计算节点进行波场的数值模拟。但是,当规模较大时,这一运算效率远远不能达到工业化的应用要求。更何况是,当模型巨大时,往往单个计算节点的内存很难满足整个计算过程的要求。解决这类
石油,作为世界最主要的一次能源,影响着工业的发展与科技的进步。随着世界对原油需求的不断增加,原油产量也不断增加。我国作为原油进口大国,原油储量严重制约工业的发展。我国从2004年开始实施战略石油储备项目,至今还未形成满足全国90天消费需求的储备能力。大型储油站所的建立,导致对储油罐内原油加热的方式越来越受到重视。射流加热作为一种加热速率高、能耗少的加热方式逐渐应用到大型储油罐内。总的来说,储油罐内
电磁成形可以改善难成形材料的成形性能,该成形过程是一种高速动态大变形过程,具有成形时间短、成形力分布均衡的特点。传统数值方法中的有限单元法因其通用性受到工程技术界的广泛重视,然而在处理上述问题时,传统的有限单元法存在着无法避免的精度过低、计算过程复杂等缺陷。同时,许多数值算法在求解大型复杂问题时计算成本与计算精度难以获得较好的平衡。而光滑有限元算法则使用低阶非结构网格,在保证计算效率同时可获得高精
作为锂/钠离子电池负极材料,锐钛矿TiO2与尖晶石结构Li4Ti5O12分别具有335 m Ah g-1和175 m Ah g-1的理论比容量,且具有体积膨胀低、储量丰富、环境友好等优点。但两种材料均存在导电性差和离子扩散率低的问题,导致其储锂/钠性能不佳。本文利用碳化过程中过量的碳对活性材料颗粒长大的抑制作用,通过喷雾热解和碳化法制备了火龙果结构的3.3 nm尺寸的TiO2/碳(3.3-TO/C