融入用户行为上下文的个性化推荐模型

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:gm_686
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化社会的不断发展,计算模式已由传统的桌面计算逐渐转变为普适计算。在这个信息空间与物理空间高度融合的环境中,用户可以随时随地、透明地享受普适环境中提供的各种服务。但是,随着服务信息的不断增长,用户很容易被淹没在信息海洋当中。因此提供一种主动的、个性化的推荐服务很有必要。近几年来,个性化服务推荐已经成为一个研究热点,并在很多领域开始应用,如Amazon、CDNOW、Netflix等大型的电子商务系统,都不同程度地使用了个性化推荐系统。但是,目前的推荐系统在预测精度、推荐质量等方面都有许多可改进之处,特别是要良好地结合用户的兴趣,而用户的当前兴趣在很大程度上又依赖于用户当前行为。因此融入用户行为上下文的个性化推荐系统成为了本文的研究重点。本文从上下文感知、本体论以及个性化推荐三个方面入手,对融入用户行为的上下文的推荐方法进行分析和研究,取得了以下主要工作成果:1.提出了一种基于本体的用户行为上下文感知子模型。该模型通过客户端感知器对用户的使用软件情况上下文进行感知,通过服务器端感知器对用户的使用服务情况上下文进行感知,并使用本体OWL语言对这些用户行为上下文进行建模。通过概率统计的方法对用户历史行为上下文进行学习,得到用户状态-时段,软件类型-用户状态以及服务类型-用户状态三张概率表格。然后对用户当前行为上下文进行计算推理,得到用户当前所处状态。最后的实验结果表明,该模型能准确预测用户当前所处状态(整体准确率达到87%),为后面的个性化推荐提供了有效的过滤和指导作用(平均服务接受率提高14.3%)。2.提出了一种本体OWL转换关系型数据库的方法。我们使用共享内联技术以及部分路径的方法将繁多的本体OWL文档转换存储至关系型数据库,使得在计算海量上下文信息时更为方便和灵活。仿真实验表明此方法在生成表数量、数据冗余度、表查询难度以及数据的修改和删除方面都有很好的效果(具体见3.3.3节算法验证与分析),在上下文存储方面有着很好的应用前景。3.提出了一种混合个性化服务推荐子模型,该模型结合了内容过滤和协同过滤推荐方法。首先使用由基于本体的用户行为上下文感知子模型中推理出的用户当前所处状态,根据服务内容的分类特征使用内容过滤方法选择m个推荐服务子类,紧接着使用k最近邻的协同过滤算法预测用户的具体评分,最后在m个服务子类中选择预测评分高的Top-N个具体服务项目组合推荐给用户。我们在协同过滤方法中使用基础评分估计来解决用户-项目评分矩阵的稀疏性问题,使得所有评分都收敛于基础评分,采用改进后的相似度计算方法使得相似度的计算偏向于基于大量用户的支持。最后的实验结果表明,此方法比传统的基于内容过滤和协同过滤的算法有着更高的预测精度(RMSE下降至0.947,比传统方法平均下降7%)。4.最后我们结合上面提到的两个子模型整合出一套系统。首先通过基于本体的用户行为上下文感知子模型采集用户的行为上下文,推理出用户当前所处状态。随后通过混合个性化服务推荐子模型中的内容过滤模块结合前面推理出的用户当前所处状态选择出m个推荐服务子类,接着通过协同过滤算法对用户-项目评分矩阵进行预测评分,最后根据一定的推荐规则产生推荐服务组合推荐给用户。最后的实验结果表明,我们的整体模型具有很好的服务接受率(在Top-10推荐中服务接受率最高可达到71%)以及良好的可扩展性(在正确预测用户当前所处状态的情况下服务接受率可达到79%)。
其他文献
工业控制领域的飞速发展,及对时间要求较严格的应用的需要,使得传统数据库无法适应某些特定领域的要求,实时数据库系统(RTDBS)应运而生。实时数据库系统不是实时系统与传统数
研究医学图像对促进医学科学的发展具有重大意义,图像分割是研究医学图像的核心问题。现今,已有学者将支持向量机应用于图像分割处理中,并能够取得较好的分割效果。但由于没有考
随着虚拟现实技术不断发展,三维地形可视化的构建在各个领域都有着广泛应用。三维地形的构建由过去的小规模构建,演变成了大规模动态地形的构建。对三维地形的模拟不再拘泥于
近年来,随着软件与硬件的飞速发展以及个人电脑和互联网的普及,基于熟人关系的网络如微信、基于同学关系的网络如人人网和基于关注关系的网络如微博等各类在线社交平台深受人
随着信息化的普及,计算机已走进了千家万户,为人们的生活带来了极大的便利。然而,在使用计算机的过程中,也会由于各种原因导致重要文件被删除或遭到破坏,造成无法挽回的损失
随着网络技术的发展和数据库应用领域的不断扩大,政府、企业、个人根据需要在互联网上发布自己的数据,而一些研究部门则研究他们发布的数据。在这些数据中包含了社会中各种各
网络流量是由不同应用类型的流量成分混合而成的,充分理解总体流量的构成以及各种成分的变化规律对网络管理和网络行为学研究具有重要意义。源宿IP、源宿端口与协议在五个维
随着互联网的发展和全球经济一体化,电子商务的建设变得非常重要。近年来,网络的迅猛发展给人们生活各个方面带来很大的便利,也使得企业向着信息化的方向发展。同时,企业的需求也
Web挖掘是将传统数据挖掘与Web结合起来的技术,其中Web使用挖掘的挖掘对象是用户和网络交互过程中抽取的Web日志数据。对这些数据挖掘可以帮助理解用户的行为,从而改进站点的
随着移动通信迅猛发展,手机已成为集通讯、报纸、广播、电视及电脑优势于一身的移动通信终端设备。MTK平台因其开发门槛低、开发周期短、功能集成度高而成为国内生产手机的主