基于社会化标注的领域专家与优质资源识别研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:lovashan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
W.eb2.0环境下,社会化标注在产业界得到了广泛应用,并出现了Delicious、Flickr、Youtube、LibraryThing、Last. fin、Connotea、 CiteUlike、Technorati等众多新的应用与体验。社会化标注允许用户在共享的网络环境中对网络资源进行无限制的标注,这种标注过程成为用户的一种资源组织方式。社会化标注因为其易用、低认知障碍、不受任何特定词表限制等特点,已经受到越来越多普通用户和领域专家用户的关注。同样的,这种特性也带来了很多问题,因为不受传统分类方法的约束,依然存在很多没有被标注却非常有价值的优质资源。此外,还有很多资源被标注上了完全无关的标签,这种垃圾标签造成了社会化标注系统的噪声。针对这些问题,本文提出了一种基于网络拓扑的社会化标注领域专家与优质资源发现模型。本文的主要研究内容有以下三点:(1)根据挖掘领域专家和优质资源的特征,用数学方法定义本研究中认定的领域专家与优质资源,并基于二者的本身特征细阐述了领域专家和优质资源之间的相互强化关系。(2)使用Delicious网站数据,并且为了减少其中其它无关因素的干扰,提出了在DEARL算法的第一阶段隔离出一个较小的数据子集,即“候选专家”,用户的标注行为显示了其专业知识和分类技术。第二个阶段,使用基于HITS算法的图形分析来分析候选专家的数据排列和优质资源所属的主题。本研究提出使用一个分布式的方法来找出标签集合中的幂集,从而识别在候选专家标注内容中频繁出现的标签子集,这样来确定Delicious网站中的兴趣主题。(3)通过候选专家的挖掘和兴趣主题的提取结果,基于网络拓扑的用户-资源有向图,建立用户-资源邻接表。基于书签权重特征,对候选专家用户书签进行赋值,最后按照权重排序结果根据识别领域专家和优质资源。经实验证明,候选专家过滤过程可以有效地减少Delicious数据图中其它无关因素的干扰。本文提出的DEARL算法与HITS算法和SPEAR算法相比,能够更准确的提取相关的兴趣主题,并能更准确寻找到领域专家和与优质资源。
其他文献
高新技术产业的崛起使技术后进国赶超技术先进国成为可能;同时发展中国家又面临着“以先进技术为特征的竞争优势通常无法通过引进技术的常规过程获取”以及“仅凭借劳动力的低
学生对零线(N)和地线(PE)的认识一直很模糊,对其作用认识不足。本文简单阐述了电力零线(N线),地线(PE线)的一些基础知识以及在供电系统中的作用,对学生来说具有很好的参考价
期刊
科学的发展和技术的进步使我们身处于知识经济时代这一大背景之中。知识经济是这样一种经济,它的基础是知识的生产、分配和使用,也就是说知识在其中以各种形式发挥着关键的作
在我国甘肃省西南部有这样一个民族——甘南藏族,该民族在悠久的历史中传承了种类繁多的传统体育项目,从这些传统体育项目中可以反映我国藏族几千年的历史、文化风俗与宗教信
期刊
支持并行设计的成本信息研究为并行设计决策提供全方位的成本信息支持,以尽可能在设计的初期阶段就充分考虑影响产品成本的各种因素,达到降低产品成本、缩短开发周期、提高设计效率,努力做到设计一次成功。 论文首先分析了产品设计过程的两种模式,串行设计和并行设计的特点,并对产品设计管理以及产品设计的关键技术进行了分析;其次对成本信息进行了分类,分别按照产品全生命周期以及成本要素分类,按照产品全生命周期分
近几年来,随着我国经济和城镇化进程的发展,城市轨道交通建设呈快速发展的势头。城市轨道交通建设作为一种大型建设项目,其建设过程错综复杂,涉及参与方众多,如何以最佳的方
故障信息管理是装备协同服务系统的重要组成部分。由于大型复杂装备故障管理的业务流程繁多,信息庞杂,传统的手工管理不能满足企业保障服务发展的要求。因此,使用计算机技术