基于RSS的WEB信息集成系统研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:hpsjsj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的快速发展,WEB已经成为有史以来最大的信息库,并且其内容仍在以指数级增长,传统的依靠浏览器以及关键字检索查询的搜索引擎已经越来越难满足人们对互联网信息服务的需要,如何从Web中快速、准确、有效的获取信息仍然是困扰着WEB用户的一个问题,在这种背景之下,出现了WEB信息集成系统,WEB信息集成系统提供了一个访问WEB上多个数据源的、统一的和透明的访问界面,它的主要目的是支持对WEB上的多个数据源的查询,满足用户的查询需求。近年来,RSS技术在WEB上得到了广泛应用,本文将RSS技术引入到WEB信息集成中,开发设计了一种基于RSS的WEB信息集成系统。 本文首先阐述了信息集成系统的发展历程,分析了WEB信息集成系统的研究现状,接着在详细研究了RSS技术的基础上,提出了一种基于RSS的WEB信息集成方法,并对该方法用到的WEB信息抽取、RSS Feed解析、网页数据获取等关键技术进行了深入研究。根据提出的集成方法,设计了一个WEB信息集成系统,并对系统的体系结构和各个功能模块做出了详细的叙述和探讨,最后,开发实现了系统,而且还对系统进行了测试。为了提高集成性能,系统还采用了多线程和OSCache页面缓存技术。 本文设计的WEB信息集成系统能对各类网站的RSS和相关网页信息快速、准确的集成,通过该系统,WEB信息获取者可以快速、高效的获得自己需要的信息,系统目前正在企业稳定运行。
其他文献
航电系统需求的增加和技术的改进使得系统性能得到不断提升,与此同时也带来了系统复杂程度的增长,航空电子系统已经成为一个软件密集型装备。在此背景下,分布式综合模块化航空电
无线Mesh网络是一种能为用户提供宽带连接服务的多跳自组织、自配置网络。随着网络不断发展和用户需求的提高,用户希望网络能提供具有服务质量(Quality of Service, QoS)保障
传统信息检索方式下,由于信息资源缺少统一的语义描述,用户难以快速查找到与需求相关的资源,难以实现信息资源的语义共享。如何使信息资源具有应用程序可以理解的含义,并根据信息
多媒体技术的迅速发展对于图像和视频压缩领域产生了重要的影响。数字视频的网络分发变得越来越普遍。不同的用户终端,通过不同的网络,接收视频服务。终端设备的接收能力以及接
为加快期刊信息化建设,实现期刊数字化、网络化,文中讨论了建立一个资源共享的期刊联盟网络平台,实现期刊门户。通过此平台,各期刊可以实现网络化办公、审稿专家库共享、全文上网
随着信息和计算机技术的飞速发展,人脸表情识别技术越来越受到研究者的关注。人脸表情识别是指利用计算机分析特定人的脸部表情及变化,进而确定其内心情绪或思想活动,实现人机更
Job Shop 调度问题(简称JSP)是具有特殊工件特性和加工环境的最典型和最重要的调度问题,是许多实际生产调度问题的简化。JSP属于NP-Hard问题,它的搜索空间随着工件和机器的增加
ZigBee是一种短距离无线通信技术。ZigBee本身的技术特点就决定了ZigBee技术在家庭自动化、工业、医学、现代化农业等领域具有广阔的应用前景,它的目标定位于现存系统所不能满
软件重用是目前解决软件危机比较现实可行的方法之一。构件及构件库的开发是软件重用的前提,构件库能有效地对可重用构件进行管理,已成为当前基于构件的软件开发的核心。如何
在分布式处理环境中,作业分配和调度的一个主要目的是平衡各处理机间的负载,并以此提高并行处理的效率。静态作业分配是指在计算前就被指派给确定的计算机。这种分配方式虽然简