大规模知识图查询划分方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yxsaisai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网用户数不断增多,用户数据规模也在不断增大。而在这大量数据中,知识图数据显得至关重要,许多领域的数据都可以用知识图模型来进行表示,如社交网络、知识图谱和推荐算法等。大规模知识图查询处理通常采用分布式方案。分布式知识图查询处理需要解决两个关键点,保存数据分布信息和查询划分。为了向查询划分提供必要的索引信息和划分依据,通过使用基于主语和宾语的双向哈希划分,并在该基础上利用范围索引记录变量的范围值。同时,设计了范围索引的存储结构,在对数据进行导入时将模式的变量范围记录并保存,为运行时查询改写提供信息输入。检索范围索引时使用多次二分查找算法提高检索效率。查询划分采用基于节点度的星型查询分解算法,并使用查询改写和代价估计对划分后查询进行优化。该算法依据节点的度数信息将原始查询语句划分为多个本地子查询,通过范围索引提供的信息对本地子查询进行改写,以达到约束中间结果集数量,并减少网络通信开销的目的。实验部分分两部分进行测试。在数据划分上,使用多种不同大小的数据集对算法进行测试,结果表明,双向哈希划分算法具有线性数据划分时间和稳定的数据冗余率;在查询划分上,对比查询分解算法改进前后的性能数据,并和其他算法进行比较分析,证明了查询优化后的查询时间比优化前快30%,而比对比算法执行时间快15%。
其他文献
学位
交流电机变频调速系统在现代工业中有着广泛的应用,其稳定性和可靠性对整个生产环境有着至关重要的作用。在变频调速系统运行时可能产生的各类故障中,功率变换器的功率器件是故障率最高的元器件之一,其开路故障的诊断方法是目前相关领域的研究热点之一。在当前的研究和实验工作中,存在实验效率低、系统监测不便、算力不足等问题,这为故障诊断算法和容错控制策略的验证、研究带来了极大的阻碍。因此,本文设计并实现了易拓展、易
目的 探讨图片式体位宣教在甲状腺手术患者体位安置与并发症防护中的应用。方法 随机选择2019年1—2021年1月甲状腺外科手术患者60例。根据患者入院前后将其分成对照组(n=30)和观察组(n=30)。对照组接受常规体位干预,观察组接受图片式体位解释法干预。比较两组患者配合程度、体位摆放时间、舒适度和并发症。结果 观察组麻醉总配合率(90.00%)和手术总配合率(100.00%)高于对照组(63.
学位
学位
学位
学位
学位
风能作为一种清洁能源在人类社会生产中发挥着重要的作用。风力发电机是捕获风能的重要设备,其大多处于海拔较高的位置,气温较低时扇叶容易覆冰。扇叶覆冰会降低风能利用率,缩短设备使用寿命,同时带来诸多安全隐患。随着工业大数据时代的到来,利用海量数据挖掘设备信息以提高生产效率成为发展的趋势。本文旨在利用风力发电机运行数据并结合机器学习理论,研究出有效的用于风力发电机扇叶覆冰检测的方法。具体工作如下:首先,针
各种现实世界中的复杂系统可以表征为网络,因此复杂的网络科学已成为进一步揭示机理和理解现实现象的有力工具。链路预测作为复杂网络分析的热点之一,引起了不同领域研究者们的极大关注。研究链路预测,在理论方面可以帮助理解信息传播和信息扩散的机制,在实际领域则可以通过已知信息向客户推荐不同的项目或有效指导复杂的实验,减少探索未知物的成本。因此,复杂网络链路预测的研究具有重要的意义。最近的研究表明,很多真实网络