不确定数据查询及优化技术研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:obo9413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不确定数据广泛存在于文本分析、信息检索、传感器网络和射频识别等领域中。随着数据采集手段的发展,客观世界中普遍存在的数据不确定性已经逐渐被人们所认识。不确定数据查询处理问题已经引发了学术界和工业界的共同关注与重视,成为新近发展起来的研究热点。   Top-k查询方法应用十分广泛。在传统确定数据处理中,top-k查询只需要返回打分函数值最大的k个数据对象,而对于不确定数据top-k查询,由于概率的存在,打分函数与概率的相互作用决定返回的查询结果,考量二者不同的结合方式则产生不同的不确定top-k查询语义。但在已有的不确定数据top-k查询语义中,只返回在可能世界中聚集概率最大的一个应答,并不能满足用户差异化的查询需求。针对这个问题,本文引入了反映查询需求的指标——需求扩展度,定义了基于需求扩展的不确定数据查询语义RU-Topk,并且提出了在新的语义下的查询算法,实验表明RU-Topk算法具有较小的平均单位查询运行时间,在满足用户需求的情况下,具备更高的查询效率。   由于概率维的存在,不确定数据top-k查询需要在与元组个数呈指数规模增长的可能世界空间中进行扫描。本文探讨了基于图形处理器(Graphic Processing Unit,GPU)的并行计算技术进行RU-Topk算法优化的方法。GPU由于其多核、多线程、高带宽、计算能力强等高性能特点,使得近年基于GPU的通用并行计算得到广泛应用。本文根据RU-Topk语义下算法的特点,探讨了在查询任务高负载情况下,基于GPU同步模式的RU-Topk查询算法的设计与实现,并通过实验验证了算法具有良好的加速比。此外,还研究了在低负载情况下,通过回归分析的方法得到基于异步模式下查询的派发策略,通过使用该策略能实现以快速性为目标的、适应性地选择CPU或GPU来执行查询,缩短单个查询响应时间,进一步提高查询性能。
其他文献
随着信息技术的发展与Internet应用的普及,越来越多的场合需要用到网络信息审计系统来对通信内容进行审计,特别是公众场合的信息安全问题亟待解决。与入侵检测系统与防火墙相比
随着网络规模的日益庞大和复杂化,如何提供有效的、高质量的信息传输服务,满足现代社会多元化的需求,是计算机网络服务质量保证的重点研究内容。文中运用随机网络演算理论中的随
数字图像恢复技术作为数字图像处理中的重要分支,被认为是适应数字化时代的一个有力支撑,并成为数字图像领域的一个研究热点。数字图像恢复技术是指在针对退化降质的图像,通过框
经过近五十年的发展,人脸识别技术已有了长足的进步,并成功应用到许多领域。但当一些如光照、表情、姿态等外界条件不理想时,算法性能下降较快。因此,如何降低这些干扰因素对
CRM (Customer Relationship Management,客户关系管理)可以泛指企业获得和维持可带来业务收益的用户群的各种技术平台,在国外已相当成熟,而在国内CRM行业还处于成长时期,随
手写体汉字识别在残疾人无障碍阅读、文献自动翻译、文献自动录入、金融单据的处理、快递包裹和信件的分拣等领域有着广阔的应用前景,帮助使用者自动录入文字,节省劳动力成本
随着社会的发展和科技的进步,人们的生活朝着数字化、智能化的方向发展,为满足人们日益增长的对现代科技成果的需求,智能小区随之兴起。但是在其发展过程中,设备和平台多样性
软件测试是软件工程学科的重要组成部分,在实际的软件开发过程中,软件测试所发挥的重要作用已得到软件开发人员的广泛认同。软件测试以发现软件中潜藏的缺陷和错误为目的,确
医学图像三维可视化是计算机可视化领域的一个重要研究分支,是当前研究的一个热点。医学图像三维可视化技术提供更多的诊断信息,辅助医生进行病情诊断和手术指导,提高了医疗
可重构计算是具备设计后芯片定制能力和能在很大程度上实现软件算法到硬件计算设备空间映射特点的计算机组织结构。作为一种新型的数字电路设计概念,可重构计算兼容了硬件计算