从商品属性到用户特征--基于生成对抗网络的新产品推荐算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:police
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务规模的不断扩大,各种各样的商品迅速出现而且种类也越来越多快,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失,一个好的推荐系统对于用户的重要性不言而喻。而冷启动问题在推荐系统中一直是一个比较重要的问题。冷启动问题是协同过滤推荐算法中被广泛关注的一个经典问题,该问题一直影响传统协同过滤推荐系统的健康发展,它的存在严重影响了推荐系统的推荐质量。对于电子商务推荐系统,每天都有大量的新用户访问系统,每天都有相当数量的新项目添加到系统中,一方面,如果推荐系统能够为新用户推荐比较喜欢的商品,推荐系统会赢得更多用户的信任,对商家来说增加了客源,提高用户对系统的忠诚度,对用户来说,可以随时得到高质量的个性化服务;另一方面,如果新商品能够及时地被推荐出去,可以提高产品的销售量,为商家赢得更大的经济利益,促进电子商务的健康发展。
  解决冷启动问题的关键障碍是缺乏用户与新产品之间的交互信息。当一个新的产品生产出来时,由于用户不知道该产品,我们无法判断用户对此产品的喜好程度。从而也就无法将产品推荐给用户。如果我们能够知道某些用户对此产品的喜好程度,那么我们可以根据用户之间的相似程度,来决定将新产品推荐给某个用户与否,从而解决冷启动问题。因此如何建立起用户与这种新产品之间的联系就成为了工作的重点。
  幸运的是产品总是有属性存在的,我们总是可以通过一个产品的属性来大体推测一下什么样的用户会对这种新的商品感兴趣。比如有一件新生产出来的羽绒服,它带有帽子,长版,羽绒含量达到99%等等的属性,我们通过这些属性可以推测出喜欢这个羽绒服的用户具有以下的特征:喜欢戴帽子,长版衣服,比起棉花更喜欢羽绒含量高的衣服。通过这种推测我们就建立起来了新产品与一个我们想象中的用户之间的联系,之后我们可以将真实的用户与我们想象的用户一一对比,从而羽绒服推荐给相似的用户。
  基于以上的思路本文提出了一种新的推荐模型:具有多个生成器的对抗性神经网络模型。我们从多个产品属性角度生成一个虚拟的用户画像,即生成的用户也是由属性特征表示。我们设计了一个对抗学习策略从而使生成的用户更加贴近于真实的用户。除此之外由于用户和商品都是属性级的表示,我们可以隐式地获得用户与商品属性级的交互信息。因此,我们可以根据属性级相似度向用户推荐新商品。我们将模型应用到了在电影和商品推荐两个项目冷启动场景上,做了大量实验,实验结果验证了我们提出的模型与最先进的基线方法相比的有效性。并且我们提出了两种用来提升推荐系统性能的方法,也通过实验验证了它们的有效性。
其他文献
摘 要:近年来,伴随着会展业的快速发展,中国会展专业人才教育与培训取得了突破性的进展。然而,中国会展专业人才的供给短缺问题仍然没有得到有效缓解,一方面会展业界仍然大呼人才短缺,另一方面会展专业毕业生却求职无门。从《商务礼仪》课程教学内容、企业需求、学生感知等角度出发,探讨会展专业人才职业素质提升的有效途径。  关键词:会展专业人才;职业素质;《商务礼仪》  中图分类号:F240 文献标志码:A 文
期刊
摘 要:从1996年的亚特兰大奥运会开始,都市类报纸就逐渐渗透到奥运赛事报道中,悉尼奥运会时就有诸多地方性都市类报纸派出各自得力干将亲临赛场采访报道,雅典、北京和伦敦更是达到了峰值,但采访条件的限制、整合编辑能力的欠缺、信息的同质化、网络和电视媒体的冲击、时差等因素总是困扰着诸多的都市类报纸。云南的生活新报通过构建媒体联盟、强化本土、做足深度、强化与读者互动等扬长避短,受到同行肯定。在此对其模式进
期刊
心音分类可用于检出异常心音、发现心血管病患者,在心血管病诊断方面能发挥重要作用,是基于心音信号的心血管病自动诊断领域的主要研究热点,吸引了众多国内外学者的研究兴趣。传统上基于经验选择心音信号特征以执行分类任务的方法,存在有效特征获取难、分类效果欠佳等不足。随着人工智能技术的发展,近年来深度学习已成为研究心音分类的主流方法,在分类性能上取得了较大提升。基于深度学习的心音分类网络一般都基于较大的神经网络所建立,需要大量训练样本来优化其权值。但是,现实中采集大量的心音数据是困难且昂贵的,从而导致难以获取充足的心
摘 要:实现世界旅游强国的战略构想为当前的旅游高等教育人才培养提出了新的挑战。旅游专业本科教育需要构建和优化精品人才的“培养链”。建立系统的精品人才培养体系涉及目标体系、内容体系、运行体系和评价体系等,其全过程必须贯彻和体现“精品”生产的意识和理念。  关键词:旅游本科;精品教育;培养模式;人才  中图分类号:F240 文献标志码:A 文章编号:1673-291X(2014)12-0239-03 
期刊
近年来,机器学习理论和应用正以惊人的速度发展并改善着人们的生活,目前机器学习算法已经广泛应用于民生、医疗、安防以及国防等领域,例如基于人脸识别的门禁和安防系统、基于指纹识别的支付系统、图像检索以及谷歌在研的无人驾驶汽车等等。随着计算机硬件、网络以及相关数据采集设备的快速发展,给人们获取丰富的数据资源带来了极大的便利,大量的数据含有丰富的信息,原则上应有助于机器学习学习到更合理的模型,但是丰富的数据也带来了数据复杂性的提高、信息过量和数据冗余等问题,甚至部分数据由于不规范的采集方式或恶劣的采集环境会出现大量
复杂网络作为复杂系统的一种图论模型,由众多节点及其间的连接关系构成,当节点与连接关系随时间发展变化时,就形成了复杂动态网络。从大系统的角度看,复杂动态网络是由节点群和连接关系群两个子系统耦合而成。在控制理论研究领域中,复杂动态网络作为一类重要的控制对象,囊括了诸如生物(人工)神经网络、移动通信网络、社会网络等许多现实网络,因而探索其结构特点、控制其群体行为等研究具有重要的实践和科学意义。
  在现有复杂网络研究领域中,实数加权复杂网络是一类重要的研究对象,它利用实数加权值的连线描述网络中节点间的连接
慢性肾小球疾病是导致终末期肾病的首要原因,而膜性肾病是慢性肾小球疾病的一个重要类型,在早期对膜性肾病进行精准诊断具有重要意义。临床上最为常用的诊断方法为免疫荧光法,但是此方法存在一定的假阳性概率且消耗较多人力成本,缺乏更为高效、准确的膜性肾病自动分类方法。高光谱成像技术通过获取光的发射、吸收与散射情况从而捕获可表征物质化学成分的光谱信息,实现了物理结构信息与生物化学成分信息的结合。深度学习(Deep Learning,DL)算法在图像处理领域具有明显优势,与传统算法相比深度算法可自适应地提取高阶特征,从而
糖尿病性视网膜病(DR)是糖尿病的并发症,是许多糖尿病患者失明的最终原因。它是一种广泛传播的眼病,影响着整个世界。在大规模糖尿病人群中对DR进行早期诊断,对于控制DR患病率、避免严重视力丧失起着至关重要的作用。当前,医学图像分析被用于执行DR的诊断。在计算机辅助诊断(CAD)系统进行DR早期筛查时,数字眼底成像(DFI)是已知的医学成像方式之一。为了在2015年至2020年间开发用于诊断DR的CAD系统,许多作者采用了基于深度学习(DL)的多层体系结构来获得高精度。深度学习方法对DR识别的有效性相比传统方
胰腺作为一个位于腹部深处的不显眼的小器官,主要负责人体复杂的内分泌和外分泌系统,其生理作用和病理变化与生命息息相关。然而,胰腺却非常容易受到各种病变的侵害,特别是胰腺癌。根据临床诊断,胰腺癌的发病率呈现不断上升的趋势,且其发病率几乎等于致死率。在临床上,计算机断层扫描图像(Computed Tomography,CT)对胰腺癌的确诊和判断能否进行手术切除发挥着非常重要的作用。因此,随着医学图像数量的不断增加和医学图像分析技术的不断进步,如何快速且准确地对胰腺定位和分析俨然已经成为了计算机辅助诊断(Comp
核方法是机器学习领域的经典模型之一,其原理是将输入的原始空间的特征映射到高维甚至无穷维空间中,并在高维空间学习得到对应的线性模型,使模型具有极强的非线性表达能力。核方法在回归、分类等任务上都有广泛的应用。作为理论较为完备的机器学习算法,其在不同场景下仍有许多亟待解决的问题:(1)在多输出回归应用中,核方法极大提升了模型的非线性表达能力,但同时导致模型的灵活性受限,尤其在处理多个输出相关性问题上,显得能力不足;(2)通常基于核方法的判别模型处理样本个体为单个样例,当处理单个样本为一个集合数据的学习任务时,现