基于协同过滤视角的受限玻尔兹曼机研究

被引量 : 83次 | 上传用户:wenty2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)是一类具有两层结构的马尔可夫随机场。近年来,随着RBM的快速学习算法–对比散度(Contrastive Divergence,CD)的出现,引起了一轮研究RBM、CD算法的理论及应用的热潮。理论方面,RBM的快速学习算法促进了机器学习界对于随机近似理论、基于能量的模型、未归一化的统计模型的研究。应用方面,目前RBM已被成功地应用于不同的机器学习问题,如分类、回归、降维、高维时间序列建模、稀疏超完备表示、图像变换、协同过滤等等。本文试图从协同过滤这一问题出发,建立RBM与协同过滤经典算法的联系,揭示RBM的内在机理,并且从协同过滤经典算法的改进出发分析受限玻尔兹曼机的不足,并尝试提出改进。1.以经典的基于用户的协同过滤算法为基础,提出了新的用户相似度度量,局部用户相似度及全局用户相似度,提出了一个基于以上两个用户相似度的协同过滤算法框架。局部用户相似度可以被视为信息检索经典算法,TF-IDF(Term Frequency–Inverse DocumentFrequency,词频-逆向文档频率)权重的一个变种,在用户相似度的计算中强调那些罕见的独特的特征。全局相似度则可视为谱图理论的一个应用,通过用户间相似度的传递,试图发现那些没有兴趣交集的用户之间的相似度。通过实验显示,基于局部用户相似度及全局用户相似度的协同过滤算法,在一定程度上缓解了协同过滤系统中的数据稀疏性问题。2.通过构建RBM与基于用户的协同过滤算法的联系,本文给出了RBM的学习算法–对比散度的一个直观的解释。由此指出受限玻尔兹曼机的非监督学习方式学习到的特征可能有时并不具有辨别力;此外,非监督学习往往会产生一个庞大冗杂的模型,从而使得利用RBM学习的特征变得效率不高。因此本文提出一种混合的三阶受限玻尔兹曼机,同时学习类别无关特征和类别相关特征,而这个混合的三阶受限玻尔兹曼机所定义的分类器只建立在类别相关的特征之上,从而具有更高的分类效率。类别无关特征在学习过程中对于类别相关特征引入了一种正则化效应,这样提出的受限玻尔兹曼机不再需要使用权重衰减(Weight-decay)来控制类别相关特征的范数的增长。3.通过分析受限玻尔兹曼机的学习算法–对比散度,提出考虑隐单元状态的统计相关性对于促使隐单元学习各自不同的特征有重要的作用。提出将隐单元分为大小相同、互不重叠的组,进而在学习过程中引入一种基于隐单元激活概率的l1/l2正则化方法来考虑局部隐单元的统计相关性。这种正则化方法不仅促使大量隐单元组保持在不激活状态,即组间稀疏,同时使得组内的隐单元也大多保持在不激活状态,即组内稀疏。因此,本文称使用这种正则化方法训练的受限玻尔兹曼机为“稀疏组受限玻尔兹曼机”(SparseGroup Restricted Blotzmann Machines,SGRBM)。实验显示,使用稀疏组RBM可以学习到一个较RBM更稀疏更好的生成模型。此外,我们也进一步应用这种正则化方法到深层玻尔兹曼机(DeepBoltzmann Machines,DBM),从而形成了稀疏组深层玻尔兹曼机(Sparse Group Deep Blotzmann Machines,SGDBM),并在两个公共数据集上取得了非常高的分类准确率。
其他文献
目的探讨SAMe-TT2R2评分、CRUSADE评分对高龄心房颤动合并冠心病经抗凝治疗后患者主要出血的预测价值。方法将在我院经抗凝治疗且随访2年的221例心房颤动合并冠心病患者作为
通过研究某半导体制造工厂应用AMC控制程序的案例,探讨关于AMC控制的具体内容,了解AMC并掌握如何制定正确的AMC评估战略、描述与建立AMC控制原则和规范、理解AMC控制系统的设计
表面润湿性是固体表面的重要特征之一。具有自清洁能力的超疏水表面的研究具有重要的理论意义和良好的应用前景。另外,表面润湿性动态可控的超疏水/超亲水性可逆转换材料因为
目的 通过重症监护室收治的1例骨饥饿综合征(HBS)导致低钙抽搐患者的临床特点的描述,结合系统文献回顾,总结HBS的救治要点,提高HBS的诊治水平及对其严重并发症的认识。方法
喷射成形(Spray Forming)作为一种新型的快速凝固制备合金的技术,其在高强铝合金制备方面具有很大的优势。国内外已经对喷射成形高强铝合金制备技术﹑组织﹑性能及热处理工艺等方面
建国50多年来,中国女性的福利状况发生了翻天覆地的变化,取得的成就不可否认,但我们仍看到国家的许多政策是由作为决策者的男性来制定的,福利是在男性框架下设计出来的,而且
涡旋光束是指一类在传输过程中波前结构呈螺旋形的新型光束,自涡旋光束被提出以来引起了广大研究者的关注。与传统的光束不同,涡旋光束的中心为暗斑,具有相位奇点并且具有轨
大学生就业能力属于职业能力的研究范畴,所以对大学生就业能力的研究不仅有利于丰富职业能力的理论,而且还有利于大学生们了解自身的职业能力,从而提升大学生们的职业能力。
研究开发基于VB的轨枕设计校核软件,实现了轨枕设计及校核的计算机程序化。使用该软件验算分析了重载轨枕主要参数对抗裂弯矩的影响程度,重点对上保护层偏差和厚度偏差提出了
提出了一种基于高斯光脉冲延迟技术的无盲区、高精度光纤长度测量方法。借助光纤延迟环的作用,在高速示波器上可以观察两路具有相对时延的高斯脉冲序列。通过调节脉冲频率可使