基于二阶隐马尔可夫模型的协同过滤算法的研究与应用

来源 :江苏大学 | 被引量 : 2次 | 上传用户:guigui1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会互联网的发展,信息资讯大量出现,这给用户在信息的选择上增加了困难。此时,以协同过滤为首的推荐技术逐渐引起了人们的关注。但是,现有的算法不可避免的存在着数据稀疏性以及过度依赖评分矩阵等局限性。在现有算法的基础上,本文利用隐马尔可夫模型里观测值与状态之间的双重随机性模拟用户的评分轨迹,从而对协同过滤的数据稀疏性进行改进,但是由于隐马尔可夫模型无后效性,它无法表示非相邻状态间的依赖关系,从而导致用户偏好中部分有用特征的丢失,该模型继承了一阶隐马尔可夫模型的优点,因此本文提出基于二阶隐马尔可夫模型的改进协同过滤算法,以及针对该算法的运行效率和用户可扩展问题而提出的聚类优化算法。最后应用本文提出的算法设计一套为大学生群体服务的信息资讯推荐原型系统。本文的主要研究工作如下:(1)针对现有的协同过滤算法中的数据稀疏性和过度依赖评分矩阵等问题,提出一种基于二阶隐马尔可夫模型的改进协同过滤算法(CF-2HMM)。该算法利用二阶隐马尔可夫模型中状态之间转移的随机性来模拟用户的兴趣变迁,根据用户的评分轨迹,找到用户下一时刻评分概率最高的项目候选集,缓解了数据稀疏性;并将获得的概率与余弦相似度加权融合,提出一种新的相似度计算方式,削弱了评分矩阵对相似度计算的重要性。MovieLens数据集上的实验结果表明,CF-2HMM算法在准确率上比基于一阶隐马尔可夫模型的改进协同过滤算法(CFHMM)提高了4.7%,比经典的基于矩阵分解的协同过滤算法(SVD)提高了6.2%,比传统的协同过滤算法(CF)提高了8.9%;为了在准确率和召回率之间取得平衡,本文考虑F1指标,CF-2HMM算法在F1指标上比CF-HMM算法提高了5.9%,比SVD算法提高了5.6%,比CF算法提高了9.2%。(2)针对CF-2HMM算法中需要为单个用户训练模型参数而用户又不断累积所面临的可扩展问题,本文提出融合评分轨迹的用户聚类算法(UCST)。该算法通过融合用户的评分轨迹对用户进行聚类,优化了聚类样本的距离度量和初始簇中心选取,然后再使用CF-2HMM算法进行推荐,提升了推荐算法的可扩展性以及计算效率。MovieLens数据集上的实验证明,经过聚类之后的CF-2HMM算法比原有的CF-2HMM算法在运行时间上明显缩短,且综合考虑算法的准确性和运行效率,用户组的最优规模为20。(3)本文设计并实现了一个信息推荐系统。针对目前大学生难以快速而准确获取想要了解的信息资讯的问题,应用本文提出的算法设计并实现了一套专为大学生群体而服务的信息资讯推荐系统,该系统充分迎合大学生的喜好与特性,除了可以为用户量身定造的推荐热点信息资讯之外,分类中还包括许多与大学生息息相关的信息资讯。
其他文献
不同于汽车前舱和尾部,汽车侧面的吸能空间较小,所以侧面碰撞造成的乘员损伤往往是重伤或致命伤。人体头颈部是车辆碰撞事故中常见的损伤部位,也是致命伤高发的区域。由于颈
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
目的探讨胚胎型大脑后循环与缺血性脑卒中发病率的相关性。方法随机搜集2011-01—2012-01在两个医院行颅脑多层螺旋CTA扫描的226例患者,排除存在脑外伤、手术、Moyamoya病、
“炸桥”之声,缘于航运被腰斩1968年12月29日.中国用9年时间白行设计和施工的南京长江大桥建成通车。它标志着中国桥梁建设的一个飞跃。南京长江大桥被收入世界吉尼斯纪录。此
20世纪80年代以来,澳大利亚教师教育机构日益重视教师教育实践性课程发展,纷纷通过教育实习环节强化职前教师的教学技能培养。悉尼大学是澳大利亚教师教育机构中的佼佼者,历
法官助理的主要职责是辅助法官进行一系列案件审理的辅助性工作,如调查取证、庭审前的准备工作、归纳总结案件的主要争议点等。正因为法官助理在案件审理程序中的辅助性地位,导致法官助理需要依靠一系列确定的规范为其提供制度保障,如针对法官助理的产生、职业定位、工作范畴、薪资待遇以及与其工作相关的其他事务的管理制度。确保法官助理制度的大范围推行以及协调法官助理与法官之间的配置模式,既是我国司法改革的趋势,也是本
技术创新是指将技术进步在市场上商业化以获取利润,或者应用于生产过程以提高效率的行为。技术进步是技术创新的源头,但不可或缺的是必须由企业将技术进步引入经济领域,才能
为了测定牛初乳对奶用雌性犊牛生长性能的影响,笔者将奶牛产仔后1 h内挤得的牛初乳饲喂初生雌性犊牛。试验选取出生状况良好,身体健康的犊牛24头,按出生顺序分为A组、B组和C
改革开放以来,长三角地区企业以代工的形式融入全球价值链体系,众多企业扎堆在此形成了中小企业集群。然而,近年该地区产业集群的去集群化现象开始逐渐显露出来。文章选取长
伴随着以大数据、物联网、人工智能等为标志的新科技浪潮的兴起,新一轮产业革命已见端倪,全球先进制造业的新格局正在形成。在此形势下,各个制造业大国为了保持自己世界经济