半结构化数据相似搜索的索引技术研究

来源 :计算机学报 | 被引量 : 0次 | 上传用户:fdsth5x1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树--CSS-树以及基于CSS-树的相似搜索与动态更新的算法。CSS-树借鉴SS^+-树基于聚类进行节点组织与分裂的基本思想,避免了根据坐标准进行分裂时所要求的维不相关性,同时在节点组织、分裂算法和搜索算法等方面进行了改进,提出了新的搜索剪枝策略,实验表明,该结构及算法对海量半结构化数据相似搜索和效率明显优于传统算法。
其他文献
针对目前总体布线中仍然存在的3个关键问题:布线结果受布线顺序的影响、总体布线图中拥挤区域的不可预见性、线网连接式样受到算法的限制等,该文提出了一种新的不受线网顺序影
以往的研究中,已经提出了利用修改Dijkstra算法或修改Bellman-Ford算法来构建最大带宽路径.本文证明可以使用修改的Kruskal算法来构建最大带宽路径,并且演示了该算法比前面提
该文提出了一种针对散乱点集的快速生成TIN的算法.该算法首先对散乱点集按扫描线方式排序,然后利用凸壳技术,以排序后的点为着眼点,通过依次扫描各点快速地将有序点集进行三
针对使用继承的传统对象系统在映射真实世界的对象关系时遇到的各种困难,提出一种普遍的软件工程方法,即扩展的面向对象方法(XOO),它通过支持双向派生、归纳、更一般的多态机制