【摘 要】
:
随着互联网的飞速发展,网络数据种类和规模极速增长,用户难以发掘出感兴趣的物品。为解决“信息超载”的问题,个性化推荐算法被广泛地研究和使用。数据稀疏程度较高且数据规模较大对推荐算法的准确率和推荐效率提出了挑战。研究高效准确的推荐算法对提升用户使用体验和企业盈利具有重要意义。本文从用户行为角度出发,在协同过滤算法的基础上针对数据稀疏性、推荐系统的可扩展性和近邻搜索的高效性等问题提出了对应的解决方案:1
论文部分内容阅读
随着互联网的飞速发展,网络数据种类和规模极速增长,用户难以发掘出感兴趣的物品。为解决“信息超载”的问题,个性化推荐算法被广泛地研究和使用。数据稀疏程度较高且数据规模较大对推荐算法的准确率和推荐效率提出了挑战。研究高效准确的推荐算法对提升用户使用体验和企业盈利具有重要意义。本文从用户行为角度出发,在协同过滤算法的基础上针对数据稀疏性、推荐系统的可扩展性和近邻搜索的高效性等问题提出了对应的解决方案:1)本文提出了基于多维特征融合的用户相似度模型FMF。由于在稀疏程度较高的数据集上使用单一维度的度量模型导致推荐准确率低下,本文分别从时间维度、地理维度以及评分等维度计算用户的相似度,最终通过加权融合得到用户的多维特征融合相似度度量模型。实验结果表明基于FMF模型的协同过滤算法在数据集ml-100k和ml-1m上预测误差均低于基准算法。2)本文提出了基于改进LSH的协同过滤算法O-LSH-CF。针对传统协同过滤算法在相似性用户的搜索和计算时由于数据规模过大维度过高存在搜索效率低下、系统可扩展性不强等问题,本文引入LSH对海量高维的用户数据进行哈希降维,并引入OPTICS算法进行预聚类和对噪声数据进行处理,然后在对应子簇进行近邻搜索,在对原始数据进行哈希降维的同时缩小搜索范围提升搜索效率。实验结果表明O-LSH-CF算法在数据集ml-100k上运行效率和准确率均优于基准算法。3)本文提出了基于近邻和多维特征约束的矩阵分解推荐算法OTML-MF。基于前面两个算法模型的基础之上提出了基于用户和项目近邻约束的矩阵分解算法以缓解推荐系统的冷启动和稀疏性问题。在计算用户和项目近邻时采用O-LSH算法进行近邻搜索以提升近邻搜索的效率,并基于FMF模型对用户相似度进行计算。另外引入羊群效应因子用于平衡用户的评分置信度,使得模型更加精准地反映用户真实的兴趣偏好。实验结果表明OTML-MF算法在数据集ml-100k和ml-1m上预测误差均低于基准算法。通过上述研究,所提出的多维特征融合的用户相似度模型能够有效地缓解数据稀疏性对推荐准确率的影响。所提出的基于改进LSH的近邻搜索模型能够有效提升推荐算法的近邻搜索效率和准确率。所提出的基于近邻和多维特征约束的矩阵分解推荐算法能够显著提升算法的推荐精度。
其他文献
计算机断层成像(Computed Tomography,CT)是一种通过X射线扫描待成像物体并采集投影数据实现内部结构成像的技术。由于X射线对人体健康的危害大,近年来,学者们研究利用传统CT重建方法基于稀疏角度X光重建CT,进而降低X射线使用剂量,但是在两个角度的重建中无法生成可理解的断层图像。而基于深度学习的图像重建方法对X光在二维空间的变化提取能力有限,且不同角度的重建结果不一致。本文通过分析
随着多媒体技术的不断发展和进步,以视频监控、远程会议和高清电视为代表的视频应用在人们的生产生活中发挥着重要的作用。然而由于当前计算机和网络系统中传输带宽、存储空间、系统输入输出性能等因素的种种限制,很多视频系统普遍存在着分辨率较低和图像质量差的问题。为了提升视频帧的图像分辨率和整体质量,视频超分辨率技术受到越来越多研究者的关注。视频超分辨率旨在通过对低分辨率视频进行一系列技术处理,增加其像素密度并
随着市场经济与科学技术的迅速发展,在人工智能的强大引擎驱动下,井喷式的出现了大量的机器学习应用场景。而监督学习表现良好则需要大量的有标签的标注数据,该任务开销庞大且繁琐无聊,故迁移学习在智能时代受到越来越多的关注。在迁移学习的相关技术中,多源领域自适应是重要的关键技术之一。多源领域自适应研究如何通过利用多个源领域知识学习目标领域,加强领域自适应能力,缓解了负向迁移。近年来,得益于人工智能和计算机视
近年来,通过计算机视觉的方法对目标物体表面进行三维重建一直是研究热点。本文以市场上常见的激光双目三维成像系统为研究对象,对该系统中涉及的关键技术:立体匹配和点云拼接,展开深入的研究,提出了重建过程中的关键步骤的优化思路,并根据优化的思路方法设计了针对性的实验来验证算法的有效性。具体来说,在立体匹配的激光光条中心提取的阶段,提出了利用方向模板的方法来优化灰度重心法在激光光条走向变化较大时的光条中心提
纳米电介质是一种具有性能可编辑潜力的新型电介质,其通过在聚合物基中均匀填充纳米颗粒可以获得优异的介电特性,被认为是未来最有潜力的电介质材料。然而,纳米填料团聚会导致纳米电介质无法达到预期的性能,甚至导致纳米电介质性能的严重退化。目前,团聚对材料的影响程度很难量化,是一个亟待解决的难题。使用扫描电子显微镜(SEM)拍摄纳米电介质图像并进行处理是一种分析团聚现象的有效手段。然而,受限于该领域图像处理的
叶面积指数(Leaf Area Index,LAI)是衡量植物生长状况的一个重要参数。它也是农业科学、生态科学、遥感科学中众多数学模型的基本参数。叶面积指数(LAI)控制着水、营养和碳循环中的许多生物和物理过程,被定义为单位地表面积的单侧绿叶面积。针对当前主流的LAI间接测量法具有误差大,精度低,稳定性低等缺点。本课题基于摄影法,将计算机视觉技术应用到LAI测量中,开展从单视角顶视法和多视角精确构
视觉定位技术作为移动机器人自主导航的核心技术,在赋能空间位置感知方面有着重要的价值。不对环境做任何限制,只依靠运动目标携带的相机就可实现定位功能的特点,使得视觉定位系统可广泛地应用于国防领域、航空航天领域、工业领域、日常生活等场景。尤其对于卫星信号缺失,有源定位无法部署或大范围覆盖的复杂环境,视觉定位更是凭借应用场景丰富,载体类型不限,成本可控的优点,在工业界和学术界引起了广泛的兴趣。视觉里程计(
航拍图像的目标检测是计算机视觉研究领域的前沿课题之一,在诸如城市土地使用类型分析,交通监测和农作物生长监测等领域都取得了广泛应用。目前应用最广泛的目标检测方法大多都基于深度学习,其中又根据是否使用一系列预先铺设好的锚框(Anchor)分为Anchor-Based和Anchor-Free两种类型,常见的Faster-RCNN、Cascade-RCNN等都属于Anchor-Based一类。最近兴起的A
近年来,移动互联网技术的快速进步和智能设备的广泛普及使得基于位置的社交网络平台得到了空前的发展。位置社交网络可以将虚拟的网络社区和真实的物理世界联系在一起,从而使用户能够通过移动设备将自己喜欢的地点分享到网络上,帮助其他用户发现有趣的地点。因此,向用户推荐感兴趣的地点成为了一个热门的研究方向。兴趣点推荐系统主要是通过用户的历史签到数据来获取用户的出行偏好,以此向用户推荐地点。但现有的关于兴趣点推荐
在实际应用中,情感分析通常是与领域相关的,由于领域之间的语义差异,相同的词在不同领域所表达的情感极性可能是矛盾的。因此,在特定领域训练好的模型,可能无法在另外一个领域很好的运行。另外,领域之间可能存在公共信息,为每个领域都训练单独的情感分类器会显得比较冗余。因此本文的工作以此作为出发点,旨在研究如何充分利用多个领域有限的训练数据来提高所有领域的分类性能。与此同时,本文会聚焦于跨领域文本情感分析场景