受限的玻尔兹曼机在背景建模和文本建模中的研究与应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:d102169104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
背景建模和文本建模分别是计算机视觉和自然语言处理两个人工智能领域关注的重点基础问题。这两个方向都是现今人工智能发展的前沿。背景建模旨在为视频序列生成一组稳定的背景,是前景检测、视频监控等应用的基础。传统的背景建模模型往往关注局部信息的利用,而实际上,在真实的复杂视频中,全局信息变化广泛存在,大到光照变化,小到物体阴影都随着时间发生变化。因此本文利用受限玻尔兹曼机针对全局信息进行建模,针对视频中相邻的两帧图片学习到视频的背景,并且设计了一种自适应的正则化项,能够强迫模型生成的背景保持稳定,也就使得模型能够准确找到背景信息。这是首次有科研工作将受限玻尔兹曼机应用于背景建模任务中。文本建模关注的是从文本中提取有用的信息,是自然语言处理领域的最常见的一类基础任务。本文关注的是近年来备受学术界关注的词向量模型工具包word2vec。目前,针对word2vec工具的解释尚缺严谨和充分的研究。由受限的玻尔兹曼机启发,本文设计了一种基于矩阵分解的模型——显式矩阵分解(EMF),并且从理论上证明了它与word2vec中的Skip-Gram Negative Sampling (SGNS)模型无条件等价,提出的模型相比于其他针对SGNS的解释工作有更好的解释性。此外,本文还从EMF模型的角度扩展出了一种有监督模型,能够结合单词类比数据,大大提高词向量在单词类比任务上的性能。
其他文献
当今的大数据应用往往具有一个共同的特点,同样的计算往往在不断变化的数据上重复执行,例如社交网络数据和网页数据。在这些应用中只是少量数据发生改变,如果重新计算则工作
近年来,随着互联网和分布式计算的发展,海量数据处理的性能有了很大提升。在许多应用领域中,都需要从海量数据中提取出增量数据来满足某种业务需求,尤其是对于不断更新的源数
企业的信息资源具有分布式和异构性等特点,随着通用数据访问提供多源、异构数据源的统一访问方式,用户通过统一访问接口可以访问数据源中的数据,继而通过可视化建模工具对数
鉴于传统语音应用系统获取信息手段单一、信息量少、成本高等缺点,本文在分析SIP协议和VoiceXML技术的基础上,采用软交换技术设计并开发了基于SIP协议的语音浏览器,实现电话
百度指数发布的《中国网民科普需求搜索行为报告》表示人们最关注“健康与医疗”科普主题,但是目前大部分有关医疗的语义搜索、查询理解和自动问答都需要依赖于其背景知识图
随着互联网应用的不断发展,传统的基于文本的音频搜索引擎在用户体验上已经无法满足人们日益增长的使用需求。近年来,基于内容的音频检索(Content-Based Audio Retrieval,CBA
随着Internet及其相关技术的飞速发展,WWW已成为最大的信息集散地。无论对企业还是个人,Web逐渐成为最主要的信息来源。然而由于网站数量过多以及由此带来的信息泛滥,使得有
随着信息化的深入发展,政务信息资源扮演着越来越重要的角色,而政务公文作为政务信息的载体,正在快速地向电子化,无纸化的方向发展。如何更好利用政务公文信息资源成为了一个
随着当今社会互联网技术的快速发展,以及图像多媒体等设备的流行,越来越多的人开始在网络上发表、下载和共享图像资源,以图像数据为代表的多媒体视觉信息量日益剧增。因此,如
随着计算机和自动数据收集工具的应用,大量的数据已经被持续地收集和存储在数据库中,由此产生了从大量数据库中挖掘令人关注的信息的巨大需求。关联规则是一种从大量数据仓库