【摘 要】
:
电子商务从刚刚兴起到成为人们日常生活中重要的角色只经过短短的三四年,如今中国的电子商务技术产业已经形成了非常庞大、完整的生态系统。电子商务的快速发展与其方便快捷、省时省力的特点密不可分,同时,由于电子商务中不需要商家与用户面对面交易,导致商家无法准确把握用户的偏好与需求。随着大规模数据行业的高速发展,电子商务行业也迅速崛起,该行业中,在用户与平台达成交易后,平台中会留下许多相关数据,包括用户特征数
论文部分内容阅读
电子商务从刚刚兴起到成为人们日常生活中重要的角色只经过短短的三四年,如今中国的电子商务技术产业已经形成了非常庞大、完整的生态系统。电子商务的快速发展与其方便快捷、省时省力的特点密不可分,同时,由于电子商务中不需要商家与用户面对面交易,导致商家无法准确把握用户的偏好与需求。随着大规模数据行业的高速发展,电子商务行业也迅速崛起,该行业中,在用户与平台达成交易后,平台中会留下许多相关数据,包括用户特征数据、用户行为数据以及用户发生行为的商品特征数据等等。如果能够有效利用这些数据,准确分析并预测用户的行为,就能为用户推荐他们的偏好商品,进而提高用户对各自推荐商品的浏览量、点击量、甚至是购买量。本篇文章把用户在电子商务平台—阿里巴巴中进行交易留下的真实的用户特征数据、商品特征数据、用户行为数据作为原始数据,通过图卷积神经网络的方法对预测用户点击购买行为进行建模。本文首先对电子商务中预测用户点击购买行为的研究背景和研究意义进行了分析,若能准确把握预测用户的点击偏好,对于提高电子商务平台业务量、满足用户需求、激发用户购买欲望、节约时间等均有重要意义;后对用户购买点击行为的预测和研究进行了文献综述,深入了解预测用户行为的国内外研究现状及当前研究的不足。之后对原始数据进行初步分析,此部分内容主要探讨了用户的各种特征与用户行为之间存在何种关系,最后就是建模的各个步骤,包括数据预处理、构建预测模型以及模型效果的比较分析。为了整合用户的行为数据并向用户推荐偏好商品,本文应用了一种使用数据分析方法——图卷积神经网络来对用户的点击购买行为进行预测。该方法首先将用户-商品的行为数据处理成二部图矩阵,同时利用用户-商品品类频率筛选方法对用户行为数据进行无效行为剔除,并用给用户随机添加商品行为的方式生成正负样本;之后对二部图矩阵进行图卷积操作,卷积操作完成后以用户本身作为根节点,拟合单层神经网络传递函数,将其余节点的信息传递至根节点上;再根据根节点的信息判断图中的用户点击行为是否正常,最后得到可用的用户点击购买行为预测模型。在得到预测模型后,需要对模型的有效性进行评估,由于使用单一评估指标不能充分解释得到的预测模型的优劣,本文还介绍了两种常用于用户推荐系统的算法:协同过滤和DeepFM。将三种方法得到的模型预测的结果进行对比分析得到,基于图神经网络的预测模型和基于DeepFM的预测模型的结果波动幅度较小,这两个模型较稳定;而基于协同过滤的预测模型的结果波动幅度较大,模型的稳定性不足。此外,本文还对比了三个模型的运行耗时和最大占用内存量,基于协同过滤的模型耗时最少、内存量占用最小;基于图神经网络的预测模型耗时最长、内存量占用最大。但综合分析模型效果与耗时量和最大内存占用量的代价可知,基于图神经网络的预测模型性能最好。本文的研究是以电子商务场景中的真实数据出发,旨在构建可用于预测用户行为的预测模型。虽然当前阶段相关研究还停留在理论阶段,但是在未来,本文得到的预测模型很有可能直接应用于真实电子商务网站的推荐系统中。
其他文献
近年来,为适应现代经济的流通需要和生产方式,道路运输行业发展迅速,在社会经济生活中发挥着愈发重要的作用。然而,道路运输在推动经济发展、促进社会生产和提高人民生活水平的同时,其所带来的道路交通安全问题也越来越显著。当前,道路交通事故已经成为威胁人民公共安全的最严重问题之一。数据显示,全国载货汽车拥有量逐年上升而载客汽车拥有量迅速下降,道路运输已占据道路汽车数量主体地位。如何进行有效的道路运输安全管理
儿童青少年是世界发展的后备力量,因此他们的身体素质好坏与否尤为重要。我国儿童青少年的身体素质主要通过力量、速度、耐力、柔韧和灵敏等指标来进行评价。儿童青少年的大量时间是在学校度过,因此,认真参与到每一节科学合理的学校体育课程便可以对学生的身体素质起到促进作用。本研究采用文献资料法、实验法、专家访谈法以及数理统计法等研究方法,将莱格尔跑练习设计进入小学高年级体育课堂,通过对实验前后测试指标成绩的变化
众所周知,股票是我们国家经济的重要组成部分之一,近年来随着国民生活水平的不断提高,越来越多的人进行股票投资交易。因此对于投资者来说,如何更加准确地预测股票的价格是一件非常重要的事情,因此,越来越多的投资者开始研究股票预测。一般投资者使用传统的技术分析方法来选择要交易的股票,而高级技术分析师则将基本指标数据和技术指标数据结合起来对股票价格进行预测。为了进一步对股票的价格趋势进行研究,科研人员使用数学
本文主要研究我国高水平青少年女子铅球运动员于天笑在固定时间内提升竞技水平的原因,运用文献资料法、专家访谈法、三维图像分析法、个案分析法、对比分析法、数理统计法对该年度训练内容进行系统的研究,其中利用专家访谈与实际跟队进行资料数据收集,并使用运动学三维图像为于天笑建立运动模型,获得重要运动学数据。在本文科研期间设立两次运动学测试,根据数据对比进行分析并得出结论。旨在全面了解青少年高水平女子铅球运动员
禁止反悔原则源于英美法系,是诚实信用原则在专利法中的延伸,在专利侵权诉讼中被不断地完善,如今已经成为大多数国家解决专利侵权纠纷的重要原则。这项原则被引入我国后,经过多年的司法实践,目前已经被编入审理专利侵权纠纷案件的司法解释中,成为专利侵权判定的一个重要原则和手段。但是现有的司法解释含义还较为模糊,实操性较差,各地法院在审理类似案件时,经常会出现判决结论相互矛盾的情况。为了能够使这项法律原则更好的
随着人类历史的发展,教育在社会、家庭中越来越受到重视,从而使得校园欺凌事件也越来越多的闯入人们视野并引起了整个社会的关注和讨论。校园欺凌极大地损害了学生们的身心健康,破坏了校园的教育教学环境,也极易发展为危害性很强的社会性问题。然而针对校园欺凌普遍存在的现状并没有一个行之有效的解决措施。本研究在大量查阅文献资料的基础上,以河北省唐山市玉田县C中学为例,对该校476名学生进行问卷调查,对2名教师进行
消除贫困是联合国千年发展的目标之一,是人类经济社会发展需要共同面对的艰巨任务。新中国成立70年来,党中央、国务院高度重视减贫扶贫,出台实施一系列中长期扶贫规划,我国反贫困事业取得的巨大成就,根据官方发布的统计数据,全国农村贫困人口由2010年1.66亿人减少至至2018年的1660万人,年均减贫1863万人,累计减贫幅度达到90.0%,贫困问题得到极大改善。目前我国正处于全面脱贫攻坚的关键时期,贫
互联网第三产业的飞速发展加速了大众消费生活方式的改善和质量的提高。5G时代的到来就是商业机遇的到来,线上企业和实体企业都乘着大数据+5G的“东风”,加快大数据和物联网的步伐。2019年10月发布的《中国汽车产业发展报告》以“面向未来出行的汽车产业变革与协同发展”为主题,同时指出科技革命必会推动汽车产业的变革。目前国内经济社会转型发展环境压力加大,社会周期结构性突发舆情因素增多,加强大数据分析研究,
随着互联网信息技术的蓬勃发展,财经新闻文本数据海量增长,这些不断丰富的网络新闻信息逐渐成为影响市场波动的重要因素。股票是当下最为常见的一种投资方式,然而股票投资在获得高收益的同时往往伴随着高风险。因此,如何利用外界价值信息提高股票预测准确度,降低投资风险,成为了研究者们关注的焦点。基于以上背景,本文从文本大数据角度出发,对财经新闻文本信息进行分析,挖掘其中所包含的情感与情绪,构建衡量投资者情绪的指
生存数据是由生存时间和影响生存时间的协变量因素组成,由于信息的完整性不同,分为完全数据和删失数据,而删失数据在生活中更为常见,具有极大的研究价值。其中删失数据的类型的多样影响着研究方法的多样化,从线性回归模型到分位数回归模型,从参数领域到非参数领域的估计方法,均是为了能够更好的拟合现实生活中复杂的数据类型和数据表现。在均值回归不能满足研究需求的情况下,引入了分位数回归思想和非参数方法,比较了核估计