Web2.0环境下高维数据的社会化协同标注与检索

来源 :复旦大学 | 被引量 : 0次 | 上传用户:king1981001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0时代的信息共享和在线协同让每个用户不但可以从互联网上获取各种信息,还能自由地发布各种信息或对已有数据添加标注。一种普遍的应用就是对论坛上发布的文章添加标签以方便分类和检索,这种加标签的方式称为社会化标注(Social Annotation)。互联网上大量用户的标注使得这些信息成为检索的重要手段。目前这种标注大多以简单添加词或短语tag为主,对文本数据(例如博客文章、论坛帖子)来说,这些简单的标签足以提高检索效率,但在互联网中还存在大量如图像、地理信息等高维数据,简单标签并不能真实地反映这类数据的内容及结构化信息。因此,对互联网上高维数据提供新的标注模型,将人们对高维数据的认识真实的反映在标注上,对于这类数据的有效检索是十分必要的。在分析现有研究工作的基础上,本文根据高维数据、社会化标注和多人协同标注的特点,对Web2.0环境下高维数据社会化协同标注的一致性维护问题和利用结构化语义标注的检索问题进行了深入的分析和研究。主要工作如下:Web2.0环境下高维数据的社会化协同标注及一致性维护。建立了高维数据的协同标注模型——结构化语义标注模型,并对标注信息进行抽象,提出冲突检测及解决算法。基于社会化标注信息的高维数据检索方法。根据新生语义和隐含语义索引建立了高维数据概念空间和概率模型,通过统计高维数据和标注信息的伴随发生概率(Co-occurrence)建立标注和数据间的新生语义关系,并作为检索结果排序的依据。用户可以获取与输入的查询有较高伴随发生概率的高维数据。高维数据的社会化协同标注原型系统与检索效果评估方法。综合上述研究成果和方法,提出了一个Web2.0环境的协同标注框架,用面向社区的图像数据为背景,实现一个支持大量用户的协同图像标注原型系统并提出检索方法。
其他文献
目前,无线Mesh网络的研究在全世界十分活跃。其中,多信道技术的应用对于无线Mesh网络的性能优化起着十分重要的作用。多信道MAC协议和多信道路由协议是无线Mesh网络多信道技
随着制造业和自动化的发展,生产物流业已成为转变经济发展方式、促进生产结构调整、以及增强国民经济竞争力的重要手段,是一个国家综合国力的重要体现。因此,如何改善生产物
软件测试是保证和提高软件质量的一种重要手段。在进行软件测试时,经常会碰到oracle问题,即程序的预期输出难以确定。蜕变测试通过检齐多个执行结果之间的关系来测试程序,有效地
软件测试是软件产品开发的重要环节,它直接关系到软件产品的质量、进度和成本。当前,程序正确性证明还不能成为软件质量保证的有效手段。在这种情况下,软件测试在将来相当长
本文对现有的语音识别技术发展现状进行了分析,研究了语音识别的基本理论,包括语音信号生成的数学模型、预处理、端点检测和特征参数提取。在此基础上,讨论了语音识别系统实
随着网络技术的飞速发展,计算机网络已经渗透到社会生活的各个方面,随之而来的网络安全问题也越来越引起人们的关注。相对于静态的防火墙技术,以数据分析为基础的、动态的入
假冒伪造给世界经济造成了巨大损失,为了维护经济秩序的正常运行,很多研究人员结合电子、信息、生物和新材料技术开发了多种防伪产品。实践表明,目前大多数防伪产品并不能真正起
本文针对高等教育自学考试命题资源之间的质量和命题人员水平差异,造成接口众多、访问性差、安全性差等多方面的结局,从而形成了一个个的“信息孤岛”,在这样的技术应用背景
由于医学影像本质上具有模糊性、不均匀性和易受噪声污染等特点,如何对所获得的医学影像进行后处理,得到更有诊疗价值的信息就变得尤为重要。本文研究了一种新的时频分析方法
在过去的十几年里,全球移动通信发展迅速,除了单一的话音业务外,数据业务也获得了极大的增长。然而,任何单一技术的无线网络都不能满足未来人们对移动通信以及普适计算的需求