基于神经网络与信息核的物品推荐算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jiaoqianqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,推荐系统已经成为解决信息过载的重要工具,协同过滤算法是推荐算法中的应用较为广泛的算法。但随着数据量的不断增加,数据稀疏性问题和可扩展性问题成为限制协同过滤算法性能提升的重要因素,研究者对此进行了大量的研究。对于数据稀疏性问题,增加辅助信息及扩充样本能够有效地缓解该问题。基于网络学习的推荐算法能够从用户的历史行为数据中更充分地学习用户偏好,并在一定程度上缓解推荐中可扩展性问题。在基于用户的协同过滤算法中,从所有用户中选取信息核,并利用信息核进行协同过滤推荐,能够提高在线推荐的效率,有效地解决可扩展性问题。考虑不同方法的特点,本文研究基于神经网络与信息核的物品推荐方法,以缓解稀疏性和可扩展性问题,同时提升推荐性能。具体工作如下:(1)提出了一种基于矩阵分解与神经协同过滤的物品评分预测方法,首先将用户物品评分矩阵通过矩阵分解方法,得到用户特征矩阵和物品特征矩阵,基于得到的用户特征矩阵,构建最近邻居特征矩阵,然后,利用神经协同过滤网络提取嵌入层的用户特征和物品特征,最后,将不同的用户和物品特征输入全连接神经网络,通过训练全连接神经网络学得用户的兴趣偏好,从而实现用户对未评价物品的评分预测。实验结果表明,基于矩阵分解与神经协同过滤的物品评分预测方法能够有效地缓解数据稀疏性影响,更充分地学习用户物品之间的联系,获得较高的预测评分准确度。(2)提出了一种基于自编码器与信息核的混合推荐方法。首先,利用物品的邻居信息构建虚拟物品进行样本集扩充,以缓解数据稀疏性问题,然后利用基于自编码器的推荐模型进行训练,并提取隐层的信息,将其作为信息核用于协同过滤推荐,最后,将自编码器模型的预测评分与基于信息核的协同过滤的预测评分相结合,并进行top-N推荐。实验结果表明,基于自编码器与信息核的混合推荐方法能够更充分地学习用户的偏好,并在缓解可扩展性问题上实现二者的相互增强,获得更高质量的推荐性能。(3)提出了一种基于物品相似性与聚类的双分支自编码网络推荐方法。首先,为了进一步地缓解数据稀疏性问题,利用物品相似性和聚类算法分别构建了相似虚拟物品集和聚类虚拟物品集。然后,构建了双分支自编码网络结构,其隐层采用了多通道编码方式更充分地挖掘用户信息,最后,将两种扩充样本输入双分支自编码网络中通过训练学习用户的偏好,并实现物品推荐。实验结果表明,基于物品相似性与聚类的双分支自编码网络推荐方法能够进一步地缓解稀疏数据的影响,提高了推荐的准确度,将其比现有的基于自编码器推荐框架的一系列算法相比,该算法在top-N推荐性能上具有较大的优势。
其他文献
C-H键官能化反应是一种通过活化C-H键实现官能团直接引入的方法,近年来被广泛应用于C-C/C-X(X=C,N,S,O等)键的构筑。C-H键的直接官能化可实现目标分子的一步合成,避免对底物的预官能化反应,减少了化合物的合成步骤,提高反应的原子经济性。将C-H官能化方法应用于构建活性中间体的先导骨架,合成具有多样活性的化合物或者具有成药潜力的化合物,对于药物化学领域的研究具有重要意义。芳基甘氨酸及氨
在大数据时代背景下,网络上的信息量呈爆炸式增长。丰富的信息资源为人们提供了诸多便利,同时产生的信息过载问题也增加了用户获取真正感兴趣信息的难度。为了解决用户的有限需求与海量数据之间的矛盾,推荐系统应运而生。其中协同过滤推荐算法作为应用最为广泛的推荐算法之一,凭借其优秀的推荐质量,获得了众多学者的青睐。传统的协同过滤推荐算法根据用户历史行为数据挖掘用户偏好,通过寻找与目标用户相似度较高的用户群体,计
大数据及其技术的应用带来了新一轮的政府治理变革创新,成为智慧政府治理的重要背景和条件,对政府的治理理念、治理结构、治理方式、治理模式与治理过程等方面都产生了重要影响。为了更好地掌握时代发展态势,实现政府治理体系和治理能力的现代化,政府应当更具“智慧”,汇聚政务大数据,打造高效能的智慧政务;建立数据驱动的决策支持系统,提升政府决策精确性;实现精细化数据管理,加速智慧服务建设;完善智能化数据监管体系,
随着数字时代的高速发展,自然语言处理现已广泛集成到Web和移动应用程序中,实现人与计算机之间的自然交互,其学科范围广泛,比如语音合成与识别、机器翻译、句法分析等等,而文字在这些研究领域中具有至关重要的作用。文字常常以报纸、电子刊物,及其网站等方式在人群中进行传递,给人民生活带来了便利,同时这些庞大的信息也令人眼花缭乱。而在这海量的文字信息中,难免也会有各种各样的错误。传统的人工校对方式在人力,物力
随着我国在互联网技术领域的不断进步,第三方支付平台应运而生,改变了传统的交易方式。第三方支付机构因其具有信用中介性、金融性和隐蔽性等特征,为电子商务的交易承担着信用担保的责任。目前,我国第三方支付产业已经进入审慎发展阶段,未来将朝着不断创新、更加安全规范的趋势发展,但是在其发展的过程中也衍生出一系列的法律问题。虽然我国对于第三方支付的监管正处于不断完善之中,但是仍存在诸多问题。在第三方支付信用额度
红外成像传感器具有捕捉物体热辐射的能力,但对场景纹理细节信息的变化不具有敏感性。可见光成像传感器具有捕捉场景空间细节信息的能力,但容易遭受周围恶劣环境的影响。因此,融合红外与可见光图像可以捕捉各波段互补特征,显示辐射目标并保留场景信息。红外与可见光图像融合技术在情报收集、监控安全以及航空航天等领域具有广泛的应用前景。为了提高红外与可见光图像的融合质量,本论文主要基于多尺度变换、卷积稀疏编码以及卷积
网络空间测绘是网络规划、可视化、网络安全以及故障诊断的基础。目前对拓扑测绘的研究主要分三个方面:实体设备扫描;逻辑拓扑探测;属性标注。在测绘特定地区网络拓扑时使用的方法包括IP地址定位技术、路由器定位技术以及边界网关IP地址识别技术。IP地址地理定位是网络拓扑测绘的基础,由于IP地址与地理信息无直接关系,如何准确定位IP地址是一个难点,现在主要通过分析注册信息、利用网络拓扑图或者搜集用户位置信息等
高光谱图像分类是遥感领域的热门研究方向,在矿物学、农学、城市规划、环境科学和军事等领域有着巨大应用价值。高光谱图像由数百个具有丰富空间和光谱信息的光谱波段组成。在训练样本有限的情况下,高光谱图像的高维度光谱信息可能导致“维度灾难”,如何有效地利用高光谱丰富的空谱信息成为高光谱分类的主要研究内容。考虑到高光谱数据集的收集代价较大,小样本情况下的特征提取问题也是高光谱分类任务的研究难点。基于上述分析,
行人重识别作为智能视频监控分析的关键任务之一,可以自动地对来自多个摄像机视角下的行人图像进行匹配。由于其在智能监控、行人跟踪、行人图像检索等方面的重要性,近年来得到了广泛的关注,并取得了显著的进展。然而,大多数现有方法的训练和测试通常是有监督的,并在单个标记数据集上进行。由于数据集之间的差异,如果将在一个数据集上训练的模型直接部署到另一个数据集上,可能会导致识别精度的显著下降。这意味着这种有监督的
生物种群的持久生存与生态系统的平衡稳定有着紧密的联系.生物多样性从概念产生之初就受到全社会的关注,它在人类可持续发展中起着不可或缺的作用.在现实生活中,生物种群经常会受到环境噪音的影响.因此,充分了解环境噪音如何影响种群生存与物种多样性十分重要.现有的研究大多是关于一种噪音的种群模型,其中缺少对系统稳定性的分析.本文主要研究带有净出生噪音与交互噪音的随机种群模型,将系统的稳定性考虑在内.通过选取适