基于数据挖掘的高校图书馆个性化信息推荐方法研究

被引量 : 0次 | 上传用户:qq774257837
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一直以来,高校图书馆在高校的教学与科研方面都扮演着一个很重要的角色,其中藏有各类图书资源、期刊、杂志以及影音数据等等,师生可以通过图书馆来增加知识、寻求疑问解答,并且培养阅读的兴趣爱好与习惯。而随着数据库技术的迅速发展及数据库管理系统在高校图书馆中的广泛应用,图书馆数据库里积累了大量读者对于图书资源的历史访问数据,这些数据背后隐藏着许许多多重要的信息。如何运用数据挖掘技术从图书馆的海量数据中挖掘出有价值的信息,给读者提供个性化的信息推荐服务,提高读者的满意度,不仅是图书馆领域亟待解决的问题之一,而且也是数据挖掘研究领域所关注的热点之一。本文首先介绍了我国高校图书馆的发展情况,分析了目前高校图书馆所面临的问题,提出了应用数据挖掘技术开展个性化信息推荐服务的思想,同时介绍了数据挖掘的相关基本理论及其研究现状。然后介绍了图书分类的相关知识,综合利用《中图法》中书籍所属索引类别构建图书索引分布树,计算书籍之间的相似度,进一步得到反映读者之间兴趣偏好近似程度的距离,结合一种基于反克鲁斯卡(Anti-Kruskal)的K-Means聚类算法对图书馆的读者进行有效的群分类,以实现针对于具有不同兴趣偏好、阅读习惯的读者群的关联规则分析。第三,对一种常见的关联规则挖掘算法—Apriori算法进行了分析,讨论了其基本思想、挖掘步骤、优缺点等,提出了一种基于Hash表的改进Apriori算法(Apriori-Hash算法),该算法利用哈希表记录不同宽度的事务标识以实现事务的快速定位,并运用hash函数来快速直接生成频繁2项集,同时利用优化剪枝和连接策略提高算法运行效率。最后结合实践设计实现了一个基于数据挖掘的个性化信息推荐服务系统模型,该模型主要由数据预处理模块、挖掘模块、可视化推荐模块等几个功能模块组成,首先从高校图书馆中提取出所需要的源数据,对其进行清洗、转换、集成等预处理工作后,得到可以实施挖掘操作数据格式的读者借阅数据集,其次利用基于反克鲁斯卡(Anti-Kruskal)的K-Means聚类算法对图书馆的读者进行有效的群分类,归纳总结出读者的兴趣偏好、阅读习惯等特征,然后利用基于Hash表的改进Apriori算法(Apriori-Hash算法)对每一读者群的借阅数据进行关联规则挖掘,找出读者所借阅图书资源之间的关联,形成针对具有不同借阅偏好、阅读习惯等特征的读者的图书推荐模式,实现为每一位读者开展个性化信息推荐服务。
其他文献
中国在移动手机用户、有线电视网络、互联网用户数量上是全球第一,但是随着互联网的飞速发展,电信运营商的优势越来越无法体现,反而被管道化,而更多的互联网企业也在竞争中面
从20世纪80年代开始我国进行了跨国并购活动。近年,受国内竞争压力加大、人民币升值、全球经济一体化趋势日益明显等因素影响,我国企业进行跨国并购的意愿更强烈。近年,中国
冷战后的国际社会,新的博弈——币缘改治争夺目益白热化。为占据币缘政治优势,美国不仅挤压欧元的成长空间,而且对人民币施加了越来越大的压力。美国正试图通过点燃人民币汇
随着计算机网络时代的飞速发展,局域网的建设是企业单位发展普及的趋向,因为局域网给人们带来很多优势。局域网的建设根据要求不同,所需的费用也不一样,小至家庭,大至企事业
埃及在阿拉伯世界及整个非洲的地位都是举足轻重的。所以,埃及“1.25革命”的发生,在埃及乃至中东地区所产生的影响是不可估量的。因此,研究这场“草根族”“出人意料”的“颠覆
本文试图暂时悬置“校本课程开发”作为一个课程术语的种种概念分析 ,把它视为一种教育的口号。以此为前提 ,文章进一步分析和探讨了这一口号所包含的种种新的课程观点和主张
在经济飞速发展今天,人力资源管理在企业管理中的地位迅速上升,人力资源也已经成为是企业的战略资源,也是企业未来竞争优势的主要来源。在当今时代,转型已成为全球电信业不可
1999年1月,我国开始实施“政府上网工程”,从此“电子政府”建设拉开了序幕。中共中央政府网站于2006年1月正式开通,则标志着我国政府网站体系基本形成。目前,政府网站不仅是
伴随着我国经济的飞速发展和社会发展日趋多样性化,我国社会公共服务的供需矛盾日益突出。全面快速增长的公共服务需求和供给的短缺让公众开始质疑政府公共服务的能力。尤其
当前世界上绝大多数发达国家和许多发展中国家普遍实行了一周工作五天的工时制,简称周五工时制.我国也于一九九五年五月开始在全国范围内实行周五工时制.毫无疑问,这一新工时