不确定数据查询及优化技术研究

来源 :广西大学 | 被引量 : 0次 | 上传用户：obo9413

【摘要】

：

不确定数据广泛存在于文本分析、信息检索、传感器网络和射频识别等领域中。随着数据采集手段的发展,客观世界中普遍存在的数据不确定性已经逐渐被人们所认识。不确定数据查

【作者】

：

俞闽敏

【机构】

：

广西大学

【出处】

：

广西大学

【发表日期】

：

2011年期

【关键词】

：

不确定数据 top-k查询查询优化需求扩展

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

不确定数据广泛存在于文本分析、信息检索、传感器网络和射频识别等领域中。随着数据采集手段的发展,客观世界中普遍存在的数据不确定性已经逐渐被人们所认识。不确定数据查询处理问题已经引发了学术界和工业界的共同关注与重视,成为新近发展起来的研究热点。　　 Top-k查询方法应用十分广泛。在传统确定数据处理中,top-k查询只需要返回打分函数值最大的k个数据对象,而对于不确定数据top-k查询,由于概率的存在,打分函数与概率的相互作用决定返回的查询结果,考量二者不同的结合方式则产生不同的不确定top-k查询语义。但在已有的不确定数据top-k查询语义中,只返回在可能世界中聚集概率最大的一个应答,并不能满足用户差异化的查询需求。针对这个问题,本文引入了反映查询需求的指标——需求扩展度,定义了基于需求扩展的不确定数据查询语义RU-Topk,并且提出了在新的语义下的查询算法,实验表明RU-Topk算法具有较小的平均单位查询运行时间,在满足用户需求的情况下,具备更高的查询效率。　　由于概率维的存在,不确定数据top-k查询需要在与元组个数呈指数规模增长的可能世界空间中进行扫描。本文探讨了基于图形处理器(Graphic Processing Unit,GPU)的并行计算技术进行RU-Topk算法优化的方法。GPU由于其多核、多线程、高带宽、计算能力强等高性能特点,使得近年基于GPU的通用并行计算得到广泛应用。本文根据RU-Topk语义下算法的特点,探讨了在查询任务高负载情况下,基于GPU同步模式的RU-Topk查询算法的设计与实现,并通过实验验证了算法具有良好的加速比。此外,还研究了在低负载情况下,通过回归分析的方法得到基于异步模式下查询的派发策略,通过使用该策略能实现以快速性为目标的、适应性地选择CPU或GPU来执行查询,缩短单个查询响应时间,进一步提高查询性能。

其他文献

传输层安全协议中数据采集的研究与实现

随着信息技术的发展与Internet应用的普及，越来越多的场合需要用到网络信息审计系统来对通信内容进行审计，特别是公众场合的信息安全问题亟待解决。与入侵检测系统与防火墙相比

学位

SSL协议网络信息审计中间人攻击数据采集

具有自相似流的无线MESH网络性能评价

随着网络规模的日益庞大和复杂化，如何提供有效的、高质量的信息传输服务，满足现代社会多元化的需求，是计算机网络服务质量保证的重点研究内容。文中运用随机网络演算理论中的随

学位

自相似流无线MESH网络性能评价

基于粗糙自适应遗传算法的图像恢复方法研究

数字图像恢复技术作为数字图像处理中的重要分支，被认为是适应数字化时代的一个有力支撑，并成为数字图像领域的一个研究热点。数字图像恢复技术是指在针对退化降质的图像，通过框

学位

粗糙自适应遗传算法算子优化适应度函数运动模糊图像恢复椒盐噪化图像恢复

基于Curvelet与PCA类方法的人脸识别技术研究

经过近五十年的发展,人脸识别技术已有了长足的进步,并成功应用到许多领域。但当一些如光照、表情、姿态等外界条件不理想时,算法性能下降较快。因此,如何降低这些干扰因素对

学位

人脸识别第二代Curvelet变换(2D)~2PCA光照衰减p矩阵距离

基于WEB的客户关系管理系统的设计与实现

CRM (Customer Relationship Management,客户关系管理)可以泛指企业获得和维持可带来业务收益的用户群的各种技术平台,在国外已相当成熟,而在国内CRM行业还处于成长时期,随

学位

客户关系管理系统J2EEB/S架构MVC架构SSH

基于深度模型的脱机手写体汉字识别研究

手写体汉字识别在残疾人无障碍阅读、文献自动翻译、文献自动录入、金融单据的处理、快递包裹和信件的分拣等领域有着广阔的应用前景,帮助使用者自动录入文字,节省劳动力成本

学位

卷积神经网络递归神经网络深度学习脱机手写体汉字识别

本体在智能小区中的应用研究

随着社会的发展和科技的进步,人们的生活朝着数字化、智能化的方向发展,为满足人们日益增长的对现代科技成果的需求,智能小区随之兴起。但是在其发展过程中,设备和平台多样性

学位

智能小区中间件服务本体推理

二叉树结构型测试数据生成方法研究

软件测试是软件工程学科的重要组成部分,在实际的软件开发过程中,软件测试所发挥的重要作用已得到软件开发人员的广泛认同。软件测试以发现软件中潜藏的缺陷和错误为目的,确

学位

测试数据生成动态数据结构二叉树二叉树形态生成遗传算法

基于MITK的医学图像三维重建研究

医学图像三维可视化是计算机可视化领域的一个重要研究分支,是当前研究的一个热点。医学图像三维可视化技术提供更多的诊断信息,辅助医生进行病情诊断和手术指导,提高了医疗

学位

医学图像MITK光线投射法三维可视化GPU

基于FPGA的局部动态可重构系统设计

可重构计算是具备设计后芯片定制能力和能在很大程度上实现软件算法到硬件计算设备空间映射特点的计算机组织结构。作为一种新型的数字电路设计概念，可重构计算兼容了硬件计算

学位

局部动态可重构模块化设计体系结构软硬件任务调度算法

不确定数据查询及优化技术研究

其他学术论文