【摘 要】
:
推荐系统是近年来大数据科学领域的热点问题之一,与之相关的研究不断涌现。本文研究了推荐系统相关的一些算法与模型,主要对决策树进行了研究。本文首先介绍了推荐系统的相关背景和研究现状,设计推荐系统时需要考虑的属性,以及个性化推荐系统的评价体系。其次,分析了推荐系统建模时会用到的特征变量,比较了基于用户和基于物品的最近邻推荐两种协同过滤算法。在对决策树的研究中,有别于以往的决策树划分方式,本文给出了决策树
论文部分内容阅读
推荐系统是近年来大数据科学领域的热点问题之一,与之相关的研究不断涌现。本文研究了推荐系统相关的一些算法与模型,主要对决策树进行了研究。本文首先介绍了推荐系统的相关背景和研究现状,设计推荐系统时需要考虑的属性,以及个性化推荐系统的评价体系。其次,分析了推荐系统建模时会用到的特征变量,比较了基于用户和基于物品的最近邻推荐两种协同过滤算法。在对决策树的研究中,有别于以往的决策树划分方式,本文给出了决策树一种新的划分方法。该方法着眼于每次划分的步数,而不是专注于信息熵增加的标准,是一种多层同时划分方法。该方法同样是以获得最大信息量为最终目的,但不是以单步获得最大信息熵增加为标准,而是多步划分之后的信息熵增加为标准。因此,本文提出的决策树构建方式将条件分布纳入考虑范围,从而有较大概率得到多步划分之后更大的信息增益。最后,本文使用了个性化推荐方面的数据集训练决策树,并与传统标准构建的决策树进行了比较,新决策树模型在节点规模,最大深度,以及预测准确率方面具有更高的效率。
其他文献
常规自适应卡尔曼滤波器虽然能够解决系统模型不确定的问题,但是当载体在高机动条件下运动时,往往导致系统性能急剧下降。为了克服该算法在组合导航系统应用中的局限性,本文
目的:观察盆腔康复操对盆腔瘀血综合征患者的临床效果。方法:98例盆腔瘀血综合征患者随机分为实验组及对照组,对照组予常规健康宣教及功能锻炼,实验组在对照组基础上采取自创盆腔
近年来,白光LED(发光二极管)具有节能环保的优点,受到了研究人员的广泛关注,并逐渐成为未来照明领域的重要组成部分。实现白光LED的方法有很多,目前比较有发展前景的方法有两种
利用生物技术解决环境中日益增长的甾体类激素污染的环境问题,寻找相关的菌及其关键基因就非常重要。本研究利用含1.6-4.1%NaCl的SIN培养基从大连海港附近所取海水样中筛选能
目的探讨建立人巨细胞病毒(HCMV)先天性感染致新生鼠肝炎模型的可行性。方法将HCMV-AD169接种至10周龄Balb/c雌雄小鼠腹腔后,随机选择配对。待雌鼠分娩后取出新生鼠肝脏,进行病
目的探讨塞来昔布对甲状腺髓样癌TT细胞体外生长及细胞周期分布的影响。方法采用3H-TdR掺入法比较不同浓度的塞来昔布对TT细胞增殖的抑制效应,流式细胞术检测肿瘤细胞周期分
近年来,W市文化和旅游业势头正酣,如何依托数字化形式整合公共文旅资源、使其发挥多方面价值迫在眉睫。本文涉及的项目背景主要是某软件开发公司承接的W市文旅云平台项目,依
情感是人对客观事物是否满足自己的需要而产生的一种态度体验.聋生由于先天或后天的主客观原因, 导致其较正常学生 “特” , 有攻击行为和自我封闭两种不良的性情特点.良好的