空间数据库中混合数据最近邻查询方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:guohuiwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网技术和全球定位技术的发展,最近邻查询广泛应用于位置信息检索,在图像检索、数据处理、模式识别以及机器学习等领域也都具有非常重要的意义。已有的查询方法主要针对点与点的近邻查询、点与线段、线段与线段的近邻查询问题,但无法直接解决点和线段混合的复杂数据的近邻查询问题,为了弥补已有方法的不足,本文提出了点和线段混合复杂数据的最近邻查询方法。首先为了解决欧氏空间下的混合数据最近邻查询问题,通过判断查询对象是查询点还是查询线段两种情况来进行查询,利用Voronoi图对数据进行初步修剪,减少数据对象的数量,给出了NN_FILTER(Point P,Line L)和LNN_FILTER(Point P,Line L)两个数据集约减算法。根据坐标法和矢量算法对点与线段的距离进行计算,再通过判断线段与线段的位置关系,用点与线段距离的计算方式来对线段到线段的距离进行计算,在这两个最短的距离之中判断出较短的距离,进而可以精确的找到其最近邻,给出了QMDNN_REFINE和LMDNN_REFINE两个数据集精炼算法。理论与实验研究表明,所提算法能有效的处理混合复杂数据的最近邻问题。进一步研究了路网环境下的最近邻查询问题。首先对数据集进行了预先处理,提出了Array(q,P,L)算法,使得线段与路网的交点与数据线段形成映射,数据点与其所在单元格的H值也形成映射。然后利用QHR树索引和最短路径定理对点和线段的混合数据集进行约减,得到NMNN_FILTER(q)算法。之后继续修剪过滤后的集合中的点,计算查询点到候选集合中的点的最短距离,对所得到的最短距离进行比较得出NMNN_Search(q)算法,进而得到精确的最近邻查询结果。这一方法解决了路网环境下的混合数据最近邻问题。
其他文献
随着硬件设备和智能显卡的发展,人工智能技术近些年有了长足的进步,同时在体育行业中的应用也逐渐增多。本课题以当下体育行业热门研究方向——冰壶运动为研究背景,结合人工
在市场竞争日益激烈的今天,作为高耗能的水泥行业也在不断寻求安全稳定运行、提高单位时间产量、节能降耗的方式,寻求在保证质量前提下,最大限度的降低单位成本以及运维成本,
会议
多目标优化潮流(Multi-objective Optimal Power Flow,MOOPF)是实现电网优化运行的主要手段,它能够在零约束违反的情况下提高经济性和稳定性。非凸、非线性和高维特性使得传
近年来,随着中国铁路的飞速发展,铁路隧道信息化、数字化、智能化建设越来越受到重视,“智慧隧道”的建设理念被逐步推广开来,这对于铁路隧道进行高效监测管理、列车安全运行以及施工人员安全作业等具有重要意义。在科学技术高度发达的今天,利用现代化信息网络技术组建高效率的铁路隧道环境监测网络,对于提升铁路隧道信息化管理程度、保障列车安全运行、提升隧道施工维护作业效率等具有重大现实意义。无线传感网络(Wirel
瞬态电子器件具有在到达预定的使用时间或者在外界条件可控触发下完全失效甚至降解的特性。硅是现代电子工业中应用最为广泛的半导体材料,但是其良好的化学稳定性制约了硅作
机组组合优化问题研究在电力系统经济调度中占据重要的地位。合理的开停机组合与负荷分配不仅可以延长机组的运行寿命,还可以提高电厂的发电效益。UC问题的研究已经取得丰富的研究成果,但相邻日影响相关研究比较薄弱。本文针对机组组合优化问题进行研究,主要工作内容如下:首先,阐述经典机组组合优化问题的数学模型。论证相邻日影响在火电机组的存在性,并且说明今日计划对次日计划产生的影响。目前大部分模型考虑到昨日影响,
目的:通过蛞蝓抗大鼠支气管哮喘作用和对小鼠止咳化痰作用研究,探讨其抗支气管哮喘作用机制,筛选蛞蝓止咳化痰活性成分。建立以活性成分为指标的含量测定方法,为蛞蝓质量控制体系的建立及蛞蝓药材的综合利用提供实验依据。方法:1.将40只SD大鼠随机分为6组,每组8只,分别为正常组、模型组、地塞米松组、蛞蝓高剂量组、蛞蝓低剂量组。除正常组外,其余各组于实验第1、8天腹腔注射10%OVA溶液1mL,第8天追加臀
下一代新型处理器,即类脑计算芯片,需要像人类大脑一样具备高并行处理能力、高容错率和高存储密度的能力,以满足人工智能的发展需求。采用新材料、新器件模拟神经突触、神经
玻璃基板作为液晶平板显示产业的关键基础元器件,被广泛的应用在各种相关产品的生产制造中,成为人们日常生活中不可或缺的一部分。用于平板液晶显示器的玻璃基板在生产制造中
随着数据自动采集技术的迅猛发展,大数据的概念已被广泛接受,传统的统计方法面临挑战。如在医学的基因数据分析中,样本可能只有几百人,而基因数量可能达到成千上万个,或数据中的噪声较多,掺杂着许多与响应变量无关的解释变量,因此希望实现变量选择而降维。基于惩罚函数的变量选择方法是一种处理高维数据常用的方法,分为三类:单变量选择、组变量选择和双层变量选择,本文主要研究基于惩罚函数的变量选择在不同线性模型、不同