论文部分内容阅读
摘 要 “标签体系 检索算法”是人们在进行资源管理,例如图书馆的馆藏资源管理、电子商务中商品管理、客户资源管理等资源管理工作中一种通用的解决问题的思路。本文介绍一种基于标签体系的快速检索算法,该算法可一定程度上解决多标签体系的场景下,对高维数据进行多关键字组合搜索引起的数据库进行大量关联运算的问题,提高检索效率,该算法和标签体系结合和形成一套高效的“标签体系 检索算法”解决方案,可应用于多种资源管理的场景。
关键词 标签体系 检索算法 高维数据索引 资源管理 高职院校图书馆
中图分类号:TP312 文献标识码:A 文章编号:1007-0745(2021)05-0057-02
1 背景概述
“标签体系 检索算法”是人们在进行资源管理,例如图书馆的馆藏资源管理、电子商务中商品管理、客户资源管理等资源管理工作中一种通用的解决问题的思路。本文介绍一种基于标签体系的快速检索算法,该算法可一定程度上解决多标签体系的场景下,对高维数据进行多关键字组合搜索引起的数据库进行大量关联运算的问题,提高检索效率,该算法和标签体系结合和形成一套高效的“標签体系 检索算法”解决方案,可应用于多种资源管理的场景。在我们的前期论文《高职院校图书馆信息系统中的标签管理功能探讨》[1]已对这一算法应用于高职院校图书馆的馆藏资源管理进行探讨,本文从另一角度进行更高抽象程度的梳理和探讨,以期待读者对这一解决方案和算法有更深的理解,能将这一解决方案和算法应用于更多的场景。
2 算法的数学基础
这一算法的数学基础是我们在2003年一份数据挖掘课程研究报告《一种基于神经生物学原理的多维数据索引算法》中提出的:公比为2的等比数列有一个重要的特性:数列中两个任意不完全相同的子列,两个子列各自的元素之和必定不相等,这一特性可用于高效的多维数据索引算法的实现;选择公比为2是为了各子列的元素和数尽量小,从而使算法能支持更多的维数和索引值。[2]
3 算法数学基础的证明
这里证明算法的数学基础,即证明数学命题:公比为2的等比数列,对于数列中任意两个不完全相同的子列,两个子列各自的元素之和必定不相等,这个命题在文献[2]中已给出严格证明,这里整理一个相对容易理解的证明过程如下:
(1)设有公比为2等比数列的子列A(a1,a2,a3,a4,a5),公比为2等比数列的子列B(b1,b2,b3,b4,b5),两个子列不完全相同,不妨设从右往左逐个比对,第一对不同的元素是a3和b3,且a3
关键词 标签体系 检索算法 高维数据索引 资源管理 高职院校图书馆
中图分类号:TP312 文献标识码:A 文章编号:1007-0745(2021)05-0057-02
1 背景概述
“标签体系 检索算法”是人们在进行资源管理,例如图书馆的馆藏资源管理、电子商务中商品管理、客户资源管理等资源管理工作中一种通用的解决问题的思路。本文介绍一种基于标签体系的快速检索算法,该算法可一定程度上解决多标签体系的场景下,对高维数据进行多关键字组合搜索引起的数据库进行大量关联运算的问题,提高检索效率,该算法和标签体系结合和形成一套高效的“標签体系 检索算法”解决方案,可应用于多种资源管理的场景。在我们的前期论文《高职院校图书馆信息系统中的标签管理功能探讨》[1]已对这一算法应用于高职院校图书馆的馆藏资源管理进行探讨,本文从另一角度进行更高抽象程度的梳理和探讨,以期待读者对这一解决方案和算法有更深的理解,能将这一解决方案和算法应用于更多的场景。
2 算法的数学基础
这一算法的数学基础是我们在2003年一份数据挖掘课程研究报告《一种基于神经生物学原理的多维数据索引算法》中提出的:公比为2的等比数列有一个重要的特性:数列中两个任意不完全相同的子列,两个子列各自的元素之和必定不相等,这一特性可用于高效的多维数据索引算法的实现;选择公比为2是为了各子列的元素和数尽量小,从而使算法能支持更多的维数和索引值。[2]
3 算法数学基础的证明
这里证明算法的数学基础,即证明数学命题:公比为2的等比数列,对于数列中任意两个不完全相同的子列,两个子列各自的元素之和必定不相等,这个命题在文献[2]中已给出严格证明,这里整理一个相对容易理解的证明过程如下:
(1)设有公比为2等比数列的子列A(a1,a2,a3,a4,a5),公比为2等比数列的子列B(b1,b2,b3,b4,b5),两个子列不完全相同,不妨设从右往左逐个比对,第一对不同的元素是a3和b3,且a3