基于web service的领域(domain)数据抽取及导入模型的研究

来源 :河海大学 | 被引量 : 2次 | 上传用户:xtfw99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近10年来网络技术取得了突飞猛进的发展,无论从网络通讯的基础设施,还是到基于Internet的全局计算模型的研究和应用,对人们进行信息处理的方式产生了很大的影响,与此同时,也扩充和改善了对一些传统问题解决的手段。 领域数据的抽取和导入是一个尚未得到有效解决的问题,同领域内数据库之间总存在着一些特征,它们之间具有某种相似关系,而特定机构都会统一选择适合本身的数据库、网络和操作系统平台。数据的抽取和导入操作一般需要解决两个主要的问题:一方面是数据在不同数据库之间的映射问题,另一方面是关于数据的传输。以往的数据抽取和导入操作在考虑这两个问题时相对比较简单,因为应用系统所涉及的范围不大,在实际应用时也可以参入手工的成分,所以这样的系统并不具有很强的可移植性和适用性。尤其是,当应用的范围继续扩大,漫及整个internet时,旧有的解决方案更显得力不从心。 针对上述研究现状和亟待解决的问题,本文的基本思路是:以全国灌区信息化系统为背景,在研究和分析第3代网络技术(XML、WSDL、UDDI、SOAP、Web Service等)和传统信息系统的优缺点的基础之上,大胆采用新技术,突破性的利用Web Service技术解决在异构的、分散的、不确定因素较多的环境下,数据的共享和操作问题,构造出面向服务的高性能领域数据抽取及导入模型。 该模型通过获取远程数据库的结构映象,使得用户可以在本地定制源、目标数据库表之间的映射关系。同时,将定制的映射关系转化为适合网络传输的XML格式,输送到远程服务器。只要远程应用系统提供相应的数据抽取服务,整个流程就可以在不限定平台、语言、数据库、网络协议的基础上灵活的进行。 本文的工作将有助于领域应用人员通过Internet有效的使用远程高性能资源,方便地构造应用系统来解决特定领域问题,同时对于web service技术在水利领域中的具体实施具有一定的参考价值。
其他文献
工作流技术是实现企业业务流程管理自动化的一项重要的计算机技术。然而,随着Internet上电子商务的飞速发展,传统工作流管理系统越来越不能适应现代企业业务流程管理的要求,主要
随着计算机网络技术的高速发展,昂贵而特制的并行超级计算机向工作站网络转换的趋势越来越强.为了将地理上分布、异构、自治的各种工作站、PC机和专用设备通过网络连接起来实
日地空间物理是以科学数据为核心的学科,该学科的科学发现与预报保障等业务均依赖于对科学数据的处理、共享与计算分析。除了具有海量、多源、异构的大数据特征外,日地空间物
随着软件规模变得越来越大,低生产率、低质量和高费用是现今软件开发急需解决的重要问题。软件复用是缓和这些问题的最有效的方法之一。特别是随着面向对象技术的出现,为软件复
日语形态素解析是日文信息处理特有的研究课题,也是日文信息处理研究的基础。它在拼音输入、语音识别、文章校对、信息检索、文本分类、机器翻译等领域有着广泛的应用。 本
组件对象模型COM是微软提出的组件技术规范,最初目的是为了促进软件的协同工作能力,即允许两个或更多个软件应用或组件非常容易地互相合作,即便它们是由不同软件开发人员用不同
随着IP业务的快速增长,对网络带宽的需求不仅变得越来越大,而且由于IP业务量本身的不确定性和不可预见性,对网络带宽的动态分配要求也越来越迫切.传统的主要靠人工配置网络连
细分曲面造型技术是近年来计算机图形学的研究的热点课题,细分方法的各种优点使其具有广阔的应用前景.在Lee等人的论文"Multiresolution Adaptive Parameterization ofSurfac
本文探讨了数据挖掘领域中序贯模式挖掘的目的、一般方法及其并行化方法,针对并行序贯模式挖掘中需要时间最长的部分——并行计算节点之间的通信问题,提出了一种新的并行序贯