【摘 要】
:
随着Internet及其相:关技术的飞速发展,企业信息化的要求越来越迫切,其中一个很重要的方面就是企业数据的管理。如何获取异构环境中的有用数据并加以综合利用,即构建异构数据
论文部分内容阅读
随着Internet及其相:关技术的飞速发展,企业信息化的要求越来越迫切,其中一个很重要的方面就是企业数据的管理。如何获取异构环境中的有用数据并加以综合利用,即构建异构数据集成系统,成为一个引起广泛关注的研究领域。本文在综合分析目前异构数据集成理论和方法的基础上,着重研究了系统实现中关键问题。 论文首先提出异构数据集成模型。模型的抽取过程采用的是一种由用户的需要和期望驱动的集成方法。当数据源“插入”系统时并不立刻抽取数据,而只是在元数据库中存储数据源的描述信息。同时,它集成了所有可以提供JDBC/ODBC接口的数据库以及未来可以提供JOLAP接口的数据仓库、各种普通使用文件系统和Web数据。 接着,设计并实现了异构数据库系统和文件系统数据集成模块,并提供了一个统一的数据访问接口,极大地提高了系统的集成能力。 然后,在提出的关于Web数据集成的3点研究假设前提下,探讨了基于规则树的Wrapper生成流程。它包括预处理、生成HTML树、生成模式树、获取映射规则、生成规则树、修复规则树和执行Wrapper。考虑到Web站点经常发生变化,研究了Wrapper维护的流程。它包括识别数据特征、定义语义块和修复规则树。通过对试验数据的分析,证明该方法合适Web数据的抽取。 最后,对异构数据集成系统实现中的研究开发工作进行了总结,并阐述了将来进一步的研究工作。
其他文献
在开放式的网络环境中,身份认证指的是用户身份的确认技术,它是网络安全的一道重要防线。无疑,口令是最简单也是最常用的一种身份认证方法。但通常使用的静态口令有许多固有的弱
入侵检测系统(IntrusionDetectionSystem,IDS)是计算机安全领域重要的技术之一,它和防火墙一起对主机和网络构建了全方位的防护。随着计算机软硬件的提高和安全技术研究的不断
传统的数据大多数都是存储在关系数据库中,随着XML成为网络上信息交换、共享的标准,许多厂商都推出了支持XML的产品,但由于目前组织内部的信息系统如ERP系统大多还是建立在具
税收是我国经济建设和社会发展的重要基础,发票又是我国征税的主要依据,然而由于发票使用的分散性,税务部门无法对发票使用作很好的监控,导致国家税收的大量流失。税控系统就
随着Internet技术及应用的迅速发展,我国企事业单位的管理已经由传统的管理逐步转化为信息的管理,信息管理就是对业务流程中无序的信息进行系统化管理,实现信息收集,处理,共享和再
本文通过分析当前消息中间件研究把重心都放在异构环境的屏蔽和以消息中间件为核心的系统集成上而忽视对传送的数据种类不同而分治的现状。对消息中间件的传输数据进行分
为了确保服务质量,租户和服务提供商之间会签订服务水平协议(Service LevelAgreements, SLA),它定义了Web服务的一些指标,如响应时间,活跃用户数,放弃率和可用性等。随着云计算平台
Vague集理论是一种模糊集理论的推广理论,它既考虑了事物本身的模糊性又考虑了人们认识能力有限导致的未知性。本文对vague集理论性质研究的基础上给出了一种基于大小和未知度
互联网的发展为传统教育带来巨大的发展机遇和挑战。通过互联网进行个性化教学的网络学习方式对教学资源建设提出了新的要求,包括规范化、独立性、资源组织以及提高资源的利
本文介绍了拥塞的基本概念、产生的原因以及拥塞控制的分类,分析了当前拥塞控制中存在的主要问题。网络上存在两种拥塞控制机制,一种是端到端拥塞控制机制,另一种是IP层的拥塞控