论文部分内容阅读
人类社会正处于工业社会向信息社会迈进的变革中,信息在我们的生活中起着越来越深远的影响。世界上的资源分为三类:物质、能量和信息。欧廷格(A.G.Oettinger,美国哈佛大学信息政策研究中心主任)认为:没有物质,就什么都不存在;没有能量,就什么都不会发生;没有信息,就什么都没有意义(Without materials,nothing exists;Without energy,nothing happens;without information,nothing makes sense)。对于信息来说,如果不被利用或传播,也同样没有意义。到目前为止,人类对地球数据信息的利用率还是很低的。正如戈尔所说的: 不管人们对信息的需求多么迫切,这些存储在电子数据仓库中的影像并未在人们脑海中拥有一席之地。我们过去的农业政策通常是这样的:一边是贮藏在中西部仓库中的粮食正在腐烂,而同时另有数百万计的灾民被饿死。我们同样面临这一问题,一边是对知识的饥渴,另一边却是大量的数据闲置在那里未被使用(阿尔·戈尔,《数字地球:21世纪认识我们这个星球的方式》)。 如此大量的数据资源,如此多样的数据格式,为综合数据管理和信息共享提出了更高的要求。综合数据管理与信息共享的必要性表现在以下三个方面: 1.可持续发展的需要 2.科学与技术发展的需要 3.现有的硬件设施、数据和人员 根据目前综合数据管理和信息共享的现状和发展方向,结合元数据技术、智能代理技术和网格技术,论文研究基于元数据的综合数据管理和信息共享方法并建立了“数字成都”综合信息资源管理系统平台,本文主要内容包括: 1.按综合信息分类,在元数据理论的基础上,改进了元数据的管理和组织,①分析了结构化数据和非结构化数据管理中的共性以及不同之处;②针对研究区的实际情况,制定研究区元数据标准模板;③采用元数据组织管理的三层体系结构:元数据子集、元数据实体和元数据元素。元数据元素是元数据的最基本的信息单元,元数据实体是同类元数据元素的集合,元数据子集是相互关联的元数据实体和元素的集合。在同一个子集中,实体可以有两类即简单实体和复合实体,简单实体只包含元素,复合实体既包含简单实体又包含元素,同时复合实体与简单实体及构成这两种实体的元素之间具有继承关系。 2.提出基于A gent的信息挖掘技术,设计和开发数据综合管理。通过具有一定智能性的搜索策略建模,实现对元数据库的快速检索,数据的快速下载,数据的交互预览和信息缓存机制. 3.本次研究是针对多种分散的数据源像对待一个信息源那样对它们进行访问和处理。若将数据汇总到本地供应用程序利用可简化应用程序的开发,并能提高数据访问性能和可用性.但也会增加数据移动、存储及同步管理的负担和成本.但如果是另外一种情况,即如果访问的数据种类太多(这种情况下复制数据不现实或成本过高)或数据并非自己所有,那么原地访问数据可能是更好的选择。在不移动数据或转换平台的情况下集成数据,对存放于任意地点的、多种分散的数据的访问与对单个数据源中数据的访问并无二致。我们以元数据为基础,提供了对多种数据源,包括对结构化和非结构化数据的访问. 4.建立基于元数据的信息共享平台.构造包括应用层、综合层、交换层和数据层,基于信息网络、互联互通、资源共享的信息资源基诵出服务平台,即“数字成都”综合信息资源管理系统.它通过对全市各部门、各行业、各领域的信息最大限度地整合、共享与集成,为政府、企业和公众提供快速、系统和简洁的各种信息服务,最终实现城市的信息化、网络化、可视化和智能化。