【摘 要】
:
大数据管理旨在建立支持多种模型、多种类型数据的数据中心。数据湖和数据仓库是构建多种模型数据存储很有前途的体系结构。集成的数据中心在多模态查询处理上面临着很多问题,比如现有的查询语言语义不够丰富、现有的索引调优技术不足以应对复杂的多模态场景、目前尚未有成熟的多模态查询处理技术等。为了提高多模态查询处理的效率,本文研究了多模态查询处理的关键技术,包括统一灵活多模态查询语言Multi-SQL的设计、面向
【基金项目】
:
CCF-华为数据库创新计划 (编号:DB 索引推荐 2019005B): 多模态数据智能管理系统关键技术研究与开发项目;
论文部分内容阅读
大数据管理旨在建立支持多种模型、多种类型数据的数据中心。数据湖和数据仓库是构建多种模型数据存储很有前途的体系结构。集成的数据中心在多模态查询处理上面临着很多问题,比如现有的查询语言语义不够丰富、现有的索引调优技术不足以应对复杂的多模态场景、目前尚未有成熟的多模态查询处理技术等。为了提高多模态查询处理的效率,本文研究了多模态查询处理的关键技术,包括统一灵活多模态查询语言Multi-SQL的设计、面向复杂场景的通用自动化索引调优技术研究、充分利用底层物理引擎优化的多模态查询优化算法。到目前为止,Multi-SQL是第一种基于多模态角度设计的统一查询语言,实现了多模型数据的统一管理,考虑了多模型数据的协同处理,是一种可扩展的实用查询语言,可以很容易扩展以适应更复杂的场景。首先,本文通过一些具体案例给出了Multi-SQL的用法。而后,本文给出了多模态定义语言和多模态操纵语言的具体形式化定义,并且分析了Multi-SQL的实现框架,从理论上说明了其语义多样性。此外,本文还研究了基于深度学习和深度强化学习的通用索引自调优技术(CNNIS和DRIS),能够对数据库进行完全建模,相较于人工或者基于规则的方法,本文的方法能够考虑地更加全面,时效性更高。本文提出的两种通用的索引推荐方法,分别从原始数据出发和从数据库特征建模角度出发,使用CNN和深度强化学习来解决索引自动推荐问题。最后,本文研究了一种基于依赖关系自动挖掘的两级多模态查询优化算法(Two-Optimal),可以充分利用底层引擎现有的查询优化能力,可以极大地提高查询执行效率。并且,本文在公开测试基准和自生成测试基准上都进行了测试,Two-Optimal相较于现有查询引擎提高了7.34%。
其他文献
喷嘴是双喷嘴挡板电液伺服阀中的重要零件,其设计要求高,加工难度大,并需要在加工结束后进行特殊的加工质量检测。常用的检测方法之一是喷柱测量法,操作方式为使用橡皮洗耳球吸取液压油,在喷嘴末端加压使液压油自喷嘴射出,人为观测射流形态,若射流保持一定距离的水平直射则视为喷嘴加工质量合格,若出现斜射、散射、螺旋等其他形状则视为不合格。这种方法在理论上没有足够的依据且依赖于操作人员的主观判断,在检测手法上效率
随着自动驾驶的发展,自动驾驶仿真测试技术受到越来越多人的关注。而其中的图像传感器由于价格低廉且获取信息足够丰富受到了自动驾驶系统开发者的青睐,图像算法数量增长迅猛,而对于图像算法的仿真测试需求也随之暴增。目前图像仿真测试方法有两种,第一种是使用相机采集的真实数据进行仿真测试,但是这种方式测试场景受限制,且驾驶条件改变也较为困难;第二种则是使用仿真软件进行测试,这种方法虽然场景搭建自由灵活、且能轻易
空间目标图像质量对空间在轨导航、空间目标识别与空间在轨操作等任务的成败有着重要的影响,而空间在轨任务的对象往往是非合作目标,没有参考图像作为标准。开展无参考标准的空间目标图像质量评估方法研究对未来在轨服务具有重要指导意义。本文重点开展单帧无参考标准的空间目标图像质量评估方法、基于目标三维重建结果的空间目标序列图像质量评估方法研究。首先,建立空间目标图像质量评估标准库。根据空间目标图像在采集过程中的
超声成像因其无创、方便、快捷的特点被广泛用于临床诊断。但是由于其成像特点导致图像对比度低、存在多种伪影以及噪声干扰,对医生的临床经验有着较高的要求。因此利用图像超分辨率技术改善超声图像质量具有重要的临床意义。相比于自然场景图像,超声图像缺少成对的高、低分辨率图像数据集,使得重建任务更具挑战性。本文针对超声图像的特点,采用生成对抗网络(Generative Adversarial Networks,
视频时序动作检测的目标是定位出未剪辑视频中动作片段的开始、结束时间点,并进行动作类别的分类识别,可应用于视频分析、视频搜索、智能安防等领域。现有时序动作检测技术已取得了令人瞩目的进步,但仍难以满足实际应用中的具体要求,因此是当前计算机视觉领域的热点研究问题之一。本文根据实际应用中定位视频动作的具体需求,从时序动作的准确检测、新类别动作的扩展检测、融合语义查询的动作定位三个方面提出解决方案,具体研究
随着信息化智能化社会的到来,在日常生活和工业生产中,数字图像作为人类感知信息的主要渠道变得越来越重要。但是由于复杂的成像环境,设备传输中的噪声往往会带来数字图像的退化。虽然当今时代微电子技术取得巨大进步,成像CMOS芯片像素越来越高,受噪声干扰越来越小。但硬件技术的进步并不能完全解决成像过程中的退化问题。因此本文的主要任务是:使用计算机软件算法解决去噪、去模糊、超分辨率和去马赛克这四种常见的图像复
在工业生产线上,机械臂让刚体零件的装配效率有着极大的提高,但对于线性柔软体零件,比如线缆、软绳等零件,由于自由度多,在受外在作用力的情况下,极易发生形变;并且难以根据机械臂末端位姿推测整个柔软体的位姿。因此当前柔软体装配仅靠机器人是难以完成的。本课题针对带线缆的装配问题,开展了在受限环境下线缆自动装配时存在的问题的研究,其中主要包括无标记线缆的无物理模型下的形状跟踪技术和线缆形状伺服控制的研究。本
本文以装车工业现场货车测量与定位为背景,研究了基于传统方法和深度学习的货车点云分割与测量方法。点云语义分割是三维场景理解的基本任务,在无人驾驶、增强现实、机器人避障等领域获得广泛应用。基于聚类、RANSAC模型拟合等传统点云分割方法适合于规则几何物体分割,但是算法的参数需要手工设置。为了提高算法通用性,本文基于PointNet++基本框架,结合最新的Transformer技术和注意力机制实现KNN
十九届五中全会指出,新时代新阶段的发展必须是高质量的发展,不仅要强化企业创新主体地位,提高全要素生产率,同时应遵循绿色发展、协同发展,全面塑造发展新优势。然而现有关于企业全要素生产率的研究较少关注企业生产过程中的污染问题。少数考察企业绿色全要素生产率的研究多采用将地区污染物按比例折算为企业非期望产出的做法,不仅无法真实判断企业绿色发展质量,更易因“搭便车”行为造成“公地悲剧”。重污染行业作为经济发
随着互联网技术的迅速发展,图像的应用越来越广泛,在图像的传输与存储的过程中也面临许许多多的安全与效率问题。为了实现图像的安全、快速传输,对图像加密与压缩技术的研究具有研究价值和现实意义。本文通过对超混沌系统与压缩感知进行研究,首先设计一个超混沌系统,然后将超混沌系统与压缩感知进行结合,构造安全可靠的图像压缩加密算法。接着,针对压缩感知执行效率低的问题,本文尝试将二维压缩感知引入图像压缩加密方案。本