基于图嵌入和深度学习的商品推荐算法研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:kaishizai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前推荐系统的一大研究热点是基于用户交互序列挖掘其中隐含的用户兴趣,在取得显著效果的同时,个性化推荐场景中也存在着数据稀疏性和冷启动问题。本课题基于上述几个问题进行了深入研究,具体如下:本课题利用图嵌入(Graph Embedding)技术来解决数据稀疏性和用户商品冷启动问题。在常规的图嵌入算法基础上,通过引入商品辅助信息,利用随机游走算法对商品的各类属性进行建模并获取对应的Embedding向量,之后再进一步将其融合。通过将高维稀疏的特征向量转化为低维稠密的特征向量可以解决数据稀疏性问题,同时,引入的辅助信息可以有效解决冷启动问题。图嵌入技术不仅可以解决稀疏性和冷启动问题,将预训练得到的Embedding向量输入到上层深度神经网络中,还能够加快网络的收敛速度,进一步提升模型性能。在预训练得到Embedding向量的基础上,将Transformer模型中提出的多头自注意力机制引入到商品推荐场景中,结合位置编码(Position Encoding)对用户历史购买商品间的依赖关系进行建模。之后利用AUGRU(GRU with Attentional Update gate)结构来对用户兴趣演化路径进行筛选,得到更加准确的用户兴趣向量表示。本课题将以上几种技术进行融合,提出CTR预估模型GEARec,用于商品的个性化推荐。GEARec模型由预训练的Embedding层、多头自注意力网络层、AUGRU和MLP构建而成。输入的用户行为序列Embedding向量经过多头自注意力网络层和AUGRU计算后,将结果与其他Embedding进行拼接,然后输入到MLP中自动学习特征之间的非线性关系,最后输出用户购买候选商品的概率。将本课题构建的GEARec模型与近几年主流的推荐模型进行实验对比。实验结果表明,GEARec推荐模型在Books和Electronics数据集上,相较于当前比较先进的DIEN模型,RelaImpr指标分别提升了2.27%和2.42%。同时,针对GEARec模型的各个模块进行了更加细致的对比实验,以此探究影响模型推荐效果的核心因素,进一步优化模型结构,提升推荐效果。最后,本课题设计实现了基于Spring Boot框架的商品推荐系统,将GEARec模型与推荐系统进行融合,实现RPC接口来提供商品CTR预估和Top-N推荐服务。另外,系统以表格和图表的形式统计并展示训练模型使用的实验数据,提供数据的上传下载、模型训练、模型权重文件下载等功能。
其他文献
针对现有应用型高校教学中存在的重知识轻能力、学生缺乏活力等问题,阐述了“面向能力培养、突出任务驱动”的教学理论的应用,并以“Photoshop平面设计”课程为例,提出了应用型高校课堂教学内容与方法、教学模式、考核方式3个方面的改革,为应用型高校课堂改革提供思路。
舰船等水中运动目标在航行过程中由于螺旋桨的搅动而产生的空化现象以及船体碎开波浪,在舰船的尾流内会形成大量的气泡。由于气泡气体的组分、密度和压缩率的差异,使得光波在尾流内的传输与在水体中有很大的差异,因而研究其光学特性可以用来实现对舰船的探测与识别。本文主要研究尾流气泡前向散射光场的空间分布及空间频谱特性。首先是基于Mie散射理论,计算单个气泡的散射系数及散射光强分布。采用向上递推法计算出Mie散射
随着电子技术的蓬勃发展,元器件的功率密度大幅上升,进而使得功率器件的温升激增,温度增长带来的是电子设备失效率的上升,为了提升电子设备的寿命和可靠性,就必须对其进行高效的散热设计。铝、钛、镍、铜、不锈钢等金属的泡沫材料作为密度低且具新颖物理、机械、热、电、声性能的新材料,在轻型结构、吸声、机械阻尼、生物材料,热交换器等领域大有所用。本文对泡沫金属及其散热器进行了理论、仿真和实验三个层面的研究,旨在说
随着注入式红外半实物仿真技术的快速发展,注入式半实物仿真系统对系统闭环延时和红外图像的分辨率、帧频和灰度等提出了更高的要求。因此作为注入式半实物仿真系统中关键设备之一的数据传输系统需要具备高速、低延时和远距离的数据传输能力。本文根据注入式红外半实物仿真系统的要求,设计了一套具有高速、低延时以及远距离传输特点的数据传输系统。数据传输系统可以支持上下行两条链路功能。下行链路:发送卡接收图像仿真计算机的
射频功率放大器作为射频模块的核心部件,广泛应用于物联网、传能、通信、雷达、检测等领域。作为各类射频模块中最大的耗能部件,它的功率输出能力和转换效率会直接对整个射频模块的性能产生重大影响。如何使射频功率放大器输出最大功率时实现更高的效率,已然成为当前高效率射频功率放大器的重要研究内容。本文针对高效率F类功率放大器展开研究,通过对比分析目前的文献研究成果,发现窄带F类功率放大器仍存在调试难度大、电路品
在大数据时代下,计算机系统所需处理的数据量爆炸式增长,片上网络和众核系统的逐渐成熟一定程度上缓解了系统遇到性能瓶颈的问题。但随着众核系统在计算力、通信力方面的提升,这些核心在处理数据时访问内存的频率也会增加,若不优化与内存访问服务相关的系统架构,则内存带宽无法匹配处理器核巨大的数据流通需求。增加片上网络中存储访问控制器,即内存控制器的数量可以看做增加带宽的一种方法。但随着核心逐渐增多,在满足处理器
随着人工智能技术的发展,在许多任务中,以神经网络为代表的机器学习模型已经表现出接近甚至超越人类水平的性能。但是,此模型通常是无法扩展其“功能”的静态模型。每当有新数据出现需要进行训练时,模型就需要使用全部数据重新开始训练。在现实世界中,这种做法在部分应用场景中会变得非常棘手。由于存储限制或隐私问题,很多数据可能会在给定时间后就会消失,甚至根本无法存储,这使得神经网络能够随着时间的推移进行适应和更新
随着时代的进步和科技的发展,互联网的使用更为频繁,随之而来的便是大量数据的产生.这些人们生活中产生的形形色色的数据,如若加以利用,便能给人们的生活带来更多便捷.数据挖掘就此应运而生.它通过分析数据本身的结构和数据间的关联性,将无用的信息过滤,进而提炼出更具有价值的信息.聚类作为一种典型的数据挖掘方法,也是一种无监督学习方法,能够在没有先验知识的情况下将数据划分为若干簇,使得不同簇的数据间相似性尽可
交通标志的检测识别是智能驾驶系统的关键技术之一,交通标志中含有大量有用信息,能实时提示驾驶员做出正确反应,极大地减少交通事故的发生,但由于现实环境中天气、光线、遮挡等因素的影响,交通标志的检测识别存在一定的难度。传统的检测算法在特征提取方面因受人工设定因素的影响,无法满足交通标志在多类别下检测识别的准确性与实时性的要求。基于深度学习的检测算法具有自动提取特征、计算量小等优势,受到研究者的青睐。本文
随着新型网络技术的高速发展和用户业务需求的多样化,信息网络的规模不断扩大,传统网络的诸多问题日益凸显,网络功能虚拟化(Network Function Virtualization,NFV)作为一种新型技术为解决这些问题提供了一条途径。NFV技术将网络功能与专有硬件解耦,并通过在通用硬件设备上部署虚拟网络功能(Virtualized Network Function,VNF)以完成用户请求服务,增