面向互联网视频应用的知识库的设计与构建

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:frjzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大数据出现的频率越来越高,很多行业和领域在大数据相关技术的帮助下,取得了突破性的进展。随着大数据时代到来,由传统的信息检索衍生出的垂直搜索和个性化推荐,在很大程度上帮助了人们在海量信息中更准确地找到自己感兴趣的信息。同时数据挖掘、机器学习、分布式计算等技术的快速发展,为搜索和推荐领域进一步演化提供了更多可能。在上述背景下,知识库技术在工业界和学术界的关注度日渐上升。通过使用知识库提供的知识,能帮助垂直搜索引擎更好的理解分析用户的搜索意图,帮助提升搜索结果的全面性、准确性,以提供更好的搜索体验;知识库系统的构建可以更好的分析用户特征,结合领域知识特点,有利于对推荐系统涉及到的实体进行数据描述,提供个性化推荐系统更多的优化空间。本文以国内主要的互联网视频类网站和百科类网站的数据为基础,完成了面向互联网视频应用的知识库的设计与构建。本文首先对知识库的理论和关键技术进行了研究,介绍了视频主题知识库设计分析的思路,包括对数据源的调研,对分类树、数据获取过程、记录连接过程的分析与设计,以及对主题知识库在垂直搜索和个性化推荐中的应用研究。然后,本文通过对不同网站的动态网页技术的分析研究,开发了可以定向获取指定网站主题数据内容的主题爬虫系统,为知识库构建提供了数据基础。最后,本文详细描述了视频记录连接的实现过程和实践中遇到的问题的解决办法;同时提出了一种新的匹配分类方法,该方法结合了可控的人工审核和二次迭代训练支持向量机(Support Vector Machine,简称SVM)分类器,经过大量真实数据的实验验证,匹配结果的F值达到99%;该结果也在一定程度上证明:现有文献中在人物领域的记录连接方法,经过改造可以在其他领域取得很好效果。
其他文献
本文将遗传算法和模拟退火算法相结合来求解二维优化下料问题,下料件为不规则形状,原材料上带有残损,问题具有一般性。并在Windows2000平台下,用Matlab实现上述算法。通过实
随着计算机,通讯等信息技术日新月异地发展以及网络的日益普及,作为传统文献服务机构的图书馆,其职能和社会地位正在受到新技术发展所带来的挑战,读者服务工作也随之受到很大冲击
<正>有些学者活在他的作品中,当肉体消失时,他的生命即刻在其著作中启动另一段旅程。刘泽华先生就是这样的学者。与一般中国政治思想史研究者不同,刘泽华本身就是一个思想史
一、裸斑 新建草坪裸斑.一般是没有种子或种子未发芽.原因有以下几种:(1)整地不良。通常为底土位于表层所致。(2)天气不好。如质地轻的土壤上长期干旱或质地重黏土壤的长期阴雨天气
<正>进入2014年,房地产开发商可能迎来融资严冬,销售回款难以如2013年一样持续大丰收,没有钱的日子该怎么过?一、面临找钱难(一)开发商找钱的影子银行渠道受阻2013年下半年以