基于深度学习的新闻推荐算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lujunjun_1204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着公安信息化建设的发展,警务工作中收集了大量公共安全数据,而其中的新闻信息作为国家和公安机关了解社会动态和社会信息的重要窗口被高度重视。如何通过推荐算法从这些海量的新闻数据中准确地获取到需要的信息,为引导舆论方向和监控预警舆情时间提供支持,成为了比较热门的研究方向。推荐算法作为解决信息过载的有效方法也受到了众多的关注。当前,基于内容的推荐算法因其优秀的性能成为应用最广泛的推荐算法之一,而深度学习的引入更进一步提高了推荐的精度。但是,现有推荐算法的推荐结果容易受到数据稀疏性的影响,且融合深度学习网络的方法大多又只关注了文本内容的学习,对用户行为的分析关注较少。此外,实际场景中不断新加入的新闻信息还会造成推荐系统的项目冷启动问题,这对推荐精度也造成了一定的影响。对此,本文展开了如下研究。首先,针对现有推荐算法存在数据稀疏性的问题,通过引入Skip-gram网络,提出了一种基于行为嵌入的新闻推荐模型(News Recommendation Model based on Behavior Embedding,NRMBE)。在该模型中,对用户的浏览数据先进行序列化处理,然后通过加入全局变量的形式来优化Skip-gram网络中心序列的编码方式,以此提高网络模型的学习能力,并使用改进后的Skip-gram网络来学习用户的浏览行为习惯,最后使用相似度公式计算得到目标用户的推荐序列。实验结果表明,改进的Skip-gram网络对稀疏的浏览数据的处理方式,使得推荐精度得到了一定的提升。其次,为了改善推荐中的项目冷启动问题,改进了一种基于段落嵌入的冷启动推荐模型(Cold-start Recommendation Model based on Paragraph Embedding,CRMPE)。在该改进模型中,首先利用Doc2vec网络计算出数据中原有的新闻文本与新加入的新闻文本最相似的N篇文本,然后利用为克服数据稀疏性问题而优化的Skip-gram网络计算得到这N篇文本的基于用户浏览行为的编码,并在此基础上结合数值法计算得到新文本的基于浏览行为的编码,最后通过相似度公式完成新项目的推荐。实验结果表明,融合了Doc2vec网络和改进的Skip-gram网络的冷启动推荐模型,使得推荐的准确度和覆盖率都得到了提高。最后,在上述模型基础上,设计并实现了新闻推荐原型系统。
其他文献
本文介绍了赛欧轿车发动机动力不足故障诊断与排除过程,利用数据流详细分析了动力不足的可能原因,建立正确诊断思路,最后通过检修排除故障。
目的探讨延续护理对糖尿病患者疾病知识掌握效果的影响。方法选取2015年3月~2016年3月60例2型糖尿病患者,以数字随机分组法分为观察组30例和对照组30例。对照组给予常规护理,观
精准扶贫档案是脱贫攻坚工作过程中的重要依据和工作结果的重要体现,也是脱贫攻坚战的“见证者”和“记录者”。江西省黎川县坚持“精准扶贫,档案同行”,釆取“四个精准”举
对框架剪力墙结构的外墙保温施工进行分析,对所使用的岩棉板展开研究,从其性能、技术条件、施工效果及质量控制等方面进行归纳总结。经分析,节能构造现场实体检验结果符合要
脱贫攻坚是党中央明确的一项极其重要、极为严肃的政治任务。脱贫攻坚成效如何,直接关系到“四个全面”战略布局的推进,直接决定着全面建成小康社会第一个百年奋斗目标能否如
目的:分析蒽环类药物治疗的乳腺癌患者应用心脏超声预测心肌损伤的效果。方法:118例给予蒽环类药物化疗的乳腺癌患者被选为研究对象,按照根据心肌钙蛋白Ⅰ检查结果判定的是否
煤矿中,初撑力是液压支架的主要技术参数之一,它对有效地管理顶板和保证液压支架的稳定性和安全性具有十分重要的意义。文章结合实际,分析了液压支架初撑力不足的原因,阐述了有效