【摘 要】
:
随着互联网技术的不断更新迭代,网络数据的体量和复杂性不断增大,用户从体量庞大的数据中挖掘出有价值的信息资源变得越来越困难,“信息过载”(Information Overload)问题愈
论文部分内容阅读
随着互联网技术的不断更新迭代,网络数据的体量和复杂性不断增大,用户从体量庞大的数据中挖掘出有价值的信息资源变得越来越困难,“信息过载”(Information Overload)问题愈加严重。推荐算法是缓解“信息过载”问题的主要技术手段之一,受到了学术界和工业界的广泛关注和研究。而大规模的数据量也给传统的数据处理平台和技术带来了巨大的挑战,开源的分布式计算平台Hadoop为大数据的处理提供了有效的平台支撑,得到广泛使用。本文深入研究了推荐算法的相关理论,对其中基于协同过滤的推荐算法—Slope One进行优化改进和大数据框架下的并行化实现。首先针对Slope One算法存在的缺点,在项目维度添加相似性度量方法;在用户维度进行聚类,得到目标用户的邻居集合;然后为进一步提高推荐准确性,利用集成学习思想使用集成聚类代替单一的用户聚类方法;最后在Hadoop计算平台下对提出算法进行了并行化实现。本文的主要工作如下:1.针对Slope One算法在用户维度和项目维度没有充分考虑权重影响问题,提出融合巴氏系数的用户聚类Slope One算法(BC-Slope One算法)。以巴氏系数作为权重刻画项目之间的差异,利用用户聚类找到目标用户的邻居用户集合。在真实的电影推荐数据集上进行验证,表明提出的BC-Slope One算法能在保证较低计算复杂度情况下,提高算法评分预测的准确性;2.对于推荐数据的复杂性特点,本文使用集成聚类代替单一聚类方法,提出基于集成聚类的改进Slope One算法(Mix-BC-Slope One算法)。通过在数据和算法两个方面进行研究分析,提出三种用户基聚类方法。通过三种基聚类方法生成表现优秀且差异性良好的聚类结果,再进行集成融合生成最佳聚类结果,并通过实验证明了该算法进一步改善了推荐效果;3.介绍了大数据研究现状,对Hadoop计算平台及其相关子项目HDFS、MapReduce等进行了深入研究。对基于大数据的推荐系统研究进展进行了详细介绍,结合本文提出的Mix-BC-Slope One算法进行了并行化的可行性研究分析,并且在实际大数据平台下进行了实现。最后对全文进行总结,并提出进一步的研究方向。
其他文献
2013年,习近平总书记首次提出“精准扶贫”的思想,预示着我国扶贫工作进入精准扶贫新时期。审计作为国家监督体系的重要组成部分,在脱贫攻坚任务中有着不可替代的作用。审计署及各地审计机关应当积极开展精准扶贫审计工作,发挥审计保障精准扶贫目标实现的作用。然而,精准扶贫审计项目质量的高低,会影响精准扶贫审计目标的实现程度,进而影响精准扶贫目标的实现。基于此背景,本文拟站在审计机关的角度上,对精准扶贫审计项
随着新型3D打印机和各种用途的打印材料的诞生,3D打印这项并不年轻的现在制造技术着实成为了科技界一颗明星。目前,这项技术已经被引入到包括服装、模型制造、医学以及零部件加工等领域当中,其独特的魅力就连NASA也无法抗拒。 据国外媒体报道,美国航空航天局(NASA)近日宣布成功测试了首个使用3D打印技术制造的火箭引擎组件。NASA将3D打印机制造出的火箭发动机喷嘴进行了一系列高压燃烧试验,包括液氧与
【摘 要】职业生涯规划对个人克服职业发展中的困难,取得事业成功至关重要。通过问卷调查法从了解程度、影响因素和相关意识等方面,对安徽电大学前教育专业学习者的职业生涯规划情况进行分析,据此,从开设相关课程、分层次有针对性指导、开展多种形式教育等方面提出几点思考。 【关键词】开放教育;职业生涯规划;调查;思考 【中图分类号】G718.5 【文献标识码】A 【文章编号】2095-3089(2019)
【摘要】近几年,在我国大力推行新课程教育体制改革与素质教育的大背景下,初中数学课堂教学的情况引起了国家教育部门的高度重视。教师与学生在课堂中进行互动对学生理解数学知识以及提高数学综合能力具有一定的促进作用。传统的教学模式过度重视教师在课堂中的讲解过程,忽略了与学生进行互动的作用的。在新课改政策的指导下,初中数学教师应该采用合适的教学方法与学生进行交流和互动。本文就如何实现初中数学课堂教学中的师生互
会计作为一门国际通用商业语言,会计人员如何应对新的经济时期的挑战,本文对会计理论的挑战以及会计要怎样适应新的方法、学习新的知识等方面进行了简要的分析和探讨。
最近在工作中遇到一个问题,要求统计出B列数值超过平均值的地区数据,并在指定位置以文字描述的形式显示相应地区的名称。虽然可以使用辅助单元格进行高级筛选,也可以使用条件格式,但出于操作便利的考虑,决定还是利用VBA代码实现上述要求:按下“Alt+F11”组合键,打开Microsoft Visual Basic for Applications编辑器窗口,依次选择“插入/模块”,在右侧窗格插入一个空白模
通过对植物根系向水性的机制研究,能够为植物的耐旱能力的提高,耐旱植物的选育,农业节水目标的实现,提供理论依据与技术支持。本文首先比较了甘油海藻酸筛选方法与甘露醇筛选