基于语义网的Web资源管理研究

来源 :南京信息工程大学 | 被引量 : 4次 | 上传用户:fitye228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅速发展,Web资源急剧膨胀,目前已成为最重要的网络资源。Web资源管理的主要目的是让人们准确、迅速的从多而杂的Web资源中找到感兴趣的信息,将大量无序的信息提取出并用结构化方式表示,以便于对资源的进一步操作。本文结合语义网技术对Web资源的获取、识别、分析、抽取、结构化表示和查询等进行了研究。本体是关于概念及概念间关系的描述;RDF (Resource Description Framework)是语义网中用来描述资源的通用框架,使用RDF技术描述Web资源可以为Web资源赋予语义信息,提高资源管理的效率;目前已经出现多种查询RDF的语言,本文使用的SPARQL(SPARQL Protocol and RDF Query Language)语言支持各种平台和语言,对本地或远程使用都适合。本文的主要研究内容和成果如下:(1)Web资源获取与解析。本文采用通过HTTP协议直接获取Web资源的方法,获取Web网页;再使用微软的开源库将网页转换成XML格式,通过遍历XML中所有节点,将有用信息转换成DOM树,最后使用相关控件将DOM树从内存中读取出来,以实现Web资源解析;(2)Web资源抽取。结合用户的需求和本体文件,生成抽取规则;并根据抽取规则遍历DOM树,完成Web资源的抽取;将本体引入信息抽取过程,可以解决同义词或多义词等问题,抽取结果包含了更多用户感兴趣的信息;(3)Web资源的RDF表示。通过对Redland库进行二次开发,将抽取结果用RDF/XML语法表示并存储在XML/RDF文件中;RDF技术的应用使得抽取结果带有更多的语义信息,更容易被机器处理;(4)Web资源的查询。通过研究SPARQL语言的语法、语义以及具体使用等,可以对抽取结果进一步处理。在以上研究工作的基础上,本文设计并实现了一个Web资源管理系统。该系统主要包含Web资源获取与解析、Web资源抽取、Web资源表示并对抽取结果进行查询等功能;本系统简单易用,用户并不需要具备专业知识就可以找到自己需要的信息,实验结果表明将语义网引入Web资源管理系统,可以实现对Web资源方便、有效地管理。
其他文献
云环境资源与服务类型的不确定性、动态变化性且存在虚假或欺诈的服务行为使得用户很难获取到理想的服务。因此云环境中引入服务信任评价机制十分重要。本文研究基于服务信任
语块可用于自然语言处理领域中,其中包括信息抽取、问答系统、语句相似度的比较等应用系统研究中,也可以应用于句法分析。并在这些领域中发挥了重要的作用。本文主要从句法分
如果开发的软件不能满足性能方面的需求,就会导致整个开发的失败。在软件开发之前对其进行性能评价就显得十分重要,而软件性能工程正是在软件完成前对性能进行分析的评价过程
随着Web应用技术的迅猛发展,Web应用已经涉及到人们生活的各个领域,Web应用系统漏洞检测技术日益成为国内外学习和研究的热点与重点。但是,Web应用系统漏洞自动化检测技术还处于
无线传感器网络(Wireless Sensor Network, WSN)是伴随着传感器技术、无线电通信技术、计算机网络等技术的发展而产生的一种新兴的通信技术。由于无线传感器网络一般具有规模
随着互联网技术的不断发展,社会网络逐渐渗入到人们生活的方方面面。人们进行的各种社交活动使得社会网络中每天都会产生海量的信息在用户之间传播与扩散,并且这些海量的信息
信息化进程的深入发展,使得网络安全问题日益突显。本文首先对当前网络安全现状进行了分析,发现恶意代码呈现出趋利性这一特征,这一特征决定了恶意代码由之前的主动式攻击转向隐
在机器人领域,运动学和运动规划一直占有重要的地位。无论是工业机器人,还是应用于空间探测的空间机器人,以及智能机器人,运动学都是必不可少的组成部分。为了增强机器人的灵活性
近些年TOP500的报告显示,集群所占的比例越来越大,集群系统已成为高性能计算的主流平台。随着处理器硬件的日益成熟和高速网络的发展,集群已经广泛而深入地应用到工业界。集
随着经济、社会生活持续快速的发展,环境污染、生态恶化与能源短缺问题也日趋严重。新能源的开发与使用,为生产、生活中缓解了能源供需紧张的压力,但是能源的浪费,不合理利用