【摘 要】
:
近年来,语义数据快速增长,适合于处理静态语义数据的前向链语义推理算法面对快速增长的数据,逐渐暴露出缺陷。前向链语义推理为了维持推理结果的完整性,每次数据更新都需要重
论文部分内容阅读
近年来,语义数据快速增长,适合于处理静态语义数据的前向链语义推理算法面对快速增长的数据,逐渐暴露出缺陷。前向链语义推理为了维持推理结果的完整性,每次数据更新都需要重新推理,效率十分低下。因此,对数据更新不敏感的后向链语义推理开始成为新的研究方向。后向链语义推理由查询目标驱动,在查询时根据规则集推理出查询结果。后向链语义推理算法比前向链复杂,并且推理发生在查询时,因此推理查询比单纯查询的时间开销要大不少,这是阻碍后向链语义推理走向实用的最大障碍。现有的后向链语义推理系统大多处于RDF存储与查询系统的一个子功能的地位,推理能力相对较弱。后向链语义推理的推理过程复杂、规则扩展深度大、难以并行化等特点,导致它在大规模语义数据上做推理存在着效率较低和扩展性较差等多方面的不足和缺陷。本文立足于已有的后向链推理技术,详细分析了语义推理规则集的特点,并结合当前最流行的大数据处理平台,设计了一套较为高效并且可扩展的大规模并行化语义规则后向链推理系统。本文的主要研究工作分为以下几个部分:首先,本文详细分析了后向链语义推理的过程及各阶段对语义数据的依赖,设计了本体数据闭包计算与实时推理相分离的计算策略。语义数据不同于一般的万维网数据,语义数据带有针对特定领域开发的领域本体,这些本体数据描述了领域内各种概念之间的关系,是一类相对稳定并且规模较小的数据,而日益增长的知识属于语义数据中的实例数据。在应用规则推导隐式知识时,所有有效规则都至少包含了一条本体数据作为输入,所以在后向链语义推理的逆向推理(规则扩展)过程中,本体推理模式会频繁地出现,甚至会重复性地出现,因而,其时间开销在整个后向链推理中占据很大比例。本文采用预计算本体数据闭包并将其在计算节点间共享的方法,使得本体推理模式在实时的推理阶段不需要被重复计算,因而能够降低实时推理的时间开销。其次,在后向链语义推理的逆向推理、查询、正向推理三个阶段分别设计了优化措施,进一步提高了后向链语义推理的效率。在逆向推理阶段,根据推理模式在不同层次间的数据依赖关系,尽早剪除无效推理分支;根据相互依赖的多个模式的复杂度,选择最优的推理次序。在查询阶段,设计了多表索引,并通过使用Pre-shuffle技术使得全局扫描可以跳过无关数据块,提高了查询速度。在正向推理阶段,为完全推理模式设计了绑定传播和自由变量两种优化方法;针对冗余结果的推导进行了优化,减少了重复计算和冗余结果;针对连接操作也进行了优化,减少了磁盘的读写次数和网络通信开销。最后,设计并实现了基于Spark平台的大规模分布式RDFS/OWL后向链语义推理系统。Spark是当前最流行的大数据计算平台之一,具有容错性好、可扩展性高、部署简单等优点,基于Spark的实现具有很强的通用性。实验数据显示,本文提出的RDFS/OWL后向链语义推理系统在合成数据集LUBM和真实数据集DBpedia上,都表现出了良好的推理性能,在亿条三元组上的推理开销是几秒到几十秒,并且表现出了良好的数据可扩展性和节点可扩展性。
其他文献
本课题以猴头菌为材料,通过水提醇沉法提取猴头菌多糖(Hericium esrinaceus mixture polysaccharide,HEPM),氯磺酸-吡啶法进行硫酸化修饰,得到猴头菌硫酸化多糖(Hericium esrinaceus sulfate polysaccharide mixture,S-HEPM)。对其进行分离及纯化,确定硫酸基团的取代度,分析猴头菌硫酸化多糖的糖苷键、成分及单
在逆合成孔径雷达(ISAR)探测目标的阶段性过程中,假设目标沿某个轨迹作直线运动,那么可以等效为在这段时间内目标自身的一个平动加上围绕质心的一个非常小的转动,转动导致了
汉语作为目前世界上使用人数最多的语言,语言学家对其的研究从未停止过。从最初的字处理、词处理,慢慢的向句处理、篇章处理转变,这既表明现在对于字、词处理的研究日趋成熟,
随着IP业务的迅猛增长,如何对智能光网络进行更合理的管控和更灵活的资源分配来使之高效承载IP业务成为需要考虑的关键问题。本文针对密集型业务讨论智能光网络拥塞控制问题,
在核设施退役期间,将产生大量放射性废液,这些废液将通过蒸发、离子交换、反渗透等传统处理方法处理后会产生一定量的高含盐的放射性废液。针对这部分废液,本文采用膜蒸馏技术对其进行浓缩实验研究。膜蒸馏是一种新型的蒸馏技术,其依靠疏水膜将废液和馏出液隔开,将膜两侧的温度差作为推动力,实现废液的蒸发浓缩。由于膜的疏水性导致膜蒸馏过程可以有效的截留放射性核素,所以对于放射性废液的浓缩有较大技术优势。本文从减小放
2018年以来因金融严监管叠加政府债务严监管、中美贸易摩擦以及去库存、去杠杆等因素,导致债券市场大量违约,其中民营企业债券违约最为突出,这在一定程度上降低了投资者对民营企业投资的期待和积极性,民营企业融资难、融资贵等问题更加棘手和严峻。为此,2018年10月22日,国务院为稳定和促进民营企业债券融资,重启“民营企业债券融资支持工具”,以此来支持和帮扶民营企业债券融资,鼓励民营企业通过创设信用风险缓释凭证来发行债券,在信用风险缓释工具中信用风险缓释凭证应用范围最广、规模最大
荧光纳米粒子具有表面易修饰、粒径较小、发光性能好等优点,为满足荧光纳米粒子在发光器件、生物成像、生物传感器等方面的应用需求,设计可调控发光行为的荧光纳米粒子是十分必要的。将聚集诱导发光(AIE)分子引入纳米粒子后,由于分子内运动受限,AIE荧光纳米粒子具有高的荧光强度。但实现其发光行为调控通常通过多个荧光分子的组合,该方法存在荧光光谱不稳定、重复性差和制备路线复杂等问题。因此,本论文选取具有AIE
中文文本分类作为搜索引擎的关键基础技术,对于高效而充分地从互联网上巨量的中文文本信息中挖掘出高价值中文文本信息,以满足社会发展的需求具有十分重要的作用与价值。文本
本文简要概述液态金属合金的凝固、磁性材料Fe Ni合金的性质及应用现状,详细介绍快速凝固技术、分子动力学方法及微观结构表征方法,重点模拟液态Fe Ni合金在不同条件下的快速凝固过程,以深入研究合金凝固规律和微观演变机理。首先分子动力学模拟不同冷却速率下液态Fe80Ni20合金的快速凝固过程,研究指出:四种冷却速率下,凝固的微观结构不一,对应于不同的转变温度。Fe80Ni20合金凝成晶体的临界冷速在
目的本课题调查了解HLD患者抑郁障碍的发病率、相关危险因素,并分析中医证型与HLD伴有抑郁障碍患者的HAMD 7个因子之间的关系,从而为HLD患者合并抑郁障碍的早发现,早诊断及中