【摘 要】
:
科学技术的日新月异,带来了信息的飞速膨胀。人们无时无刻不被包围在信息的海洋之中。如何对这些复杂的信息进行有效管理成为影响个人生活秩序和生活质量的重要因素。数据空间
论文部分内容阅读
科学技术的日新月异,带来了信息的飞速膨胀。人们无时无刻不被包围在信息的海洋之中。如何对这些复杂的信息进行有效管理成为影响个人生活秩序和生活质量的重要因素。数据空间以主体为中心,管理主体所关心的所有数据,无论它们分布在哪,以何种方式呈现,并为主体提供各种服务。与数据库管理系统不同,数据空间采用pay-as-you-go的进化方式,逐步形成数据空间的模式,在欠缺模式指导的情况下,为用户提供Best-effort查询服务。本文研究数据空间管理系统中的关键字查询索引技术。主要工作包括:
⑴提出了基本信息单元的概念及其获取方法。基本信息单元是某些相关数据通过相互之间的密切联系构成的一个语义比较完整的数据子集。
⑵引入基于图的查询索引模型,提出了基于基本信息单元的查询索引方法。以扩展倒排表的形式为数据空间创建相应的索引——BIU-index。BIU-index的特色在于它以基本信息单元为索引的基本单位,将用户关心的数据集合在一起,以其作为查询结果返回,为用户提供了更便捷完备的服务。
⑶利用Lucene索引工具包生成BIU-index并设计实现了数据空间的查询索引子系统,实现对多源异质异构数据的管理。
⑷通过设置相应的实验,验证BIU-index的性能及其语义完整性。
其他文献
随着无线通信技术的飞速发展,频谱资源的分配日益紧张,使得新兴无线设备无法获得授权频谱。另一方面,来自联邦通信委员会频谱策略任务组的研究报告表明:在绝大部分时间,授权频谱的
我国水资源虽然总量比较丰富,但是由于人口众多,人均水资源占有量却很低。同时,由于水资源在时间和空间上分布的不均匀,导致季节性和地域性的水资源紧张。随着社会、经济的发展,有
索引是数据仓库查询优化的重要技术,主要包括树形索引和位图索引。其中位图索引因为其结构简单,并且硬件支持二进制位运算效率很高,被广泛应用在数据仓库中。在属性的基数(该
企业联盟一般是两个或两个以上有对等经营实力的企业,各自贡献出企业价值链优势环节,实现资源共享、知识的双向或多向流动、优势互补、风险共担等战略目标,而自愿达成的一种能使联盟伙伴共同受益的长期联盟方式。在企业联盟中,企业为了应对日趋激烈的全球化竞争,开始整合产品、技术、市场等资源,与相近或互补的其他企业组成各种联盟,如技术研发联盟、市场销售联盟等,将技术专利、市场营销网络、产品知识、商情、经验等各类信
在当今信息时代,通信、计算机和网络技术的快速发展让我们能捕获和存储大量的数据,导致数据出现了爆炸性增长。在这些数据中寻找模式、趋势和异常之处,并且以简单的数量模型
随着生产和自动化水平的不断提高,电机优化设计被广泛地应用到电机产品设计中。电机的优化设计是指从预定目标出发,在满足约束的前提下,根据电机的数学模型,并借助最优化方法来得
单核苷酸多态性(SNP)是人类基因组中普遍存在的一种分子标记,主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。做为一种新的遗传标记,SNP对于疾病的预测、诊
随着智能电网与能源互联网的发展建设,电力系统规模不断扩大,电力数据以惊人的速度、多样化结构迅猛增长,这些复杂的数据来源于智能电表、配电自动化、数字保护装置等,以及在
在软件测试的过程中,自动生成测试用例是软件测试的关键和难点。目前,虽然有一些自动生成测试用例的方法被提出并使用,但由于其局限性,在实际中还没有完善的解决方法,只能凭
Web服务由于其良好的异构性,能解决不同系统的数据的交互与重组,自问世之始,就受到了学术界和工业界的欢迎,成为了人们研究的热点。但由服务提供者发布的服务的功能是特定的,