论文部分内容阅读
近年来,Web2.0平台上一个重要部件——社会标注系统或协同标注系统作为一种有效的工具为互联网用户提供信息组织和检索的功能。例如Delicious.com、 Bibsonomy.org分别允许用户使用标签标注自己感兴趣的Web页和科研文献。学界和IT业界对社会标注系统已有了较为广泛的讨论。但是,由于所标注的数据资源的海量性和分散性,现有的社会标注系统在发挥其优势的同时,也带来了一个难以解决的困难问题,即如何应对系统伴随数据规模的扩大而来的功能和效率性的不足和下降。此问题的根本原因在于目前的各类注系统主要采用基于扁平标签的社会标注模型,该模型特点是无结构的离散标注,并产生扁平无结构的标签集。面对这一问题,本文提出一种基于层级标签的社会标注模型,即鼓励用户在标注动作即时就以层级标签形式表达和保存标签之间的简单语义关系。论文对这一基于层级标签的社会标注模型的可行性和有效性开展了研究。论文分理论研究和应用研究两个部分。理论研究部分探讨了如何把用户个体层面的层级标签聚合成集体层面的分众分类的可行性,并验证所生成的分众分类在语义结构的清晰性及在信息导航上的可用性。应用研究部分在理论研究基础上设计了一个基于层级标签的渐进式分众分类生成方法,并开发了相应的原型系统。论文的要点和创新点归纳如下:第一,提出基于层级标签的标注模型。基于该模型的标注系统在支持用户表达和保存简单的语义关系同时,并可改善扁平标签结构混乱和语义不一致等问题。第二,综合采用基于实际数据的分析和基于Agent仿真的方法,通过评估分众分类导航性能的思路,验证了层级标签可在社会标注系统中的搜索导航支持方面发挥积极效果。第三,面向实际应用,初步给出了应对层级标签在实际应用中可能遇到若干问题的解决方法;最后设计了一个采用上述标注模型的社会标注原型系统。