数据挖掘在数字图书馆个性化服务中的应用

被引量 : 0次 | 上传用户:k5261715
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对现有数字图书馆个性化服务系统存在着数据分析能力欠缺、信息孤岛现象严重和个性化服务单一等问题,将数据仓库、联机分析和数据挖掘技术引入到数字图书馆个性化服务系统,并结合计算机网络技术,进行了深入的理论和实践研究。 论文运用数据仓库、联机分析处理和数据挖掘技术通过对读者、资源以及读者对资源的访问等数据对象进行分析和挖掘,设计和实现了一种基于关联挖掘和读者兴趣模型的个性化服务系统。该系统通过对数据的关联分析和挖掘以及自动地识别读者兴趣来为读者提供个性化的服务。论文的主要内容如下: (1) 采用新型决策支持系统的思想,设计出数字图书馆个性化服务系统模型,模型中突出了对数据的分析和挖掘以及读者兴趣的自动识别。 (2) 采用维度建模的方法,对读者、资源以及读者对资源的访问三个主题进行了数据仓库逻辑模型设计。 (3) 对AprioriTid算法进行了改进,算法采用事务压缩和项目压缩相结合方法,候选项目集及支持度的计算是在每条事务压缩后通过联接产生,候选项目集采用关键字识别,省去了AprioriTid算法中的剪枝和字符串模式匹配步骤,实验结果表明,改进的算法执行效率明显优于AprioriTid算法。 (4) 建立了资源访问的多维数据立方体,并利用AprioriTid改进算法对文献资源进行关联分析和挖掘,来分析资源的访问情况以及读者对资源的访问关联。 (5) 设计与实现了基于资源多层分类树的读者兴趣模型,该模型通过与读者的主动和被动交互,不断地接收读者的兴趣和推测读者的兴趣,积累读者信息需求的偏好,从而实现自适应的个性化服务。 本文所作的研究工作,对数字图书馆个性化服务系统的建设和发展打下了良好的基础。
其他文献
从互联网产业自身发展和对国民经济贡献作用两个角度对互联网未来发展趋势与方向进行了阐述与分析。通过对我国互联网产业与国民经济投入产出研究,从行业之间的关联关系——
基于目前水利工程施工建设过程中出现的问题缺陷,文章分析了围堰技术应用的作用效果以及应用原则,并提出了优化应用的措施方法,其目的是为相关建设者提供一些理论依据。结果
湖南省农业和农村的经济经过30多年的改革与发展,发生了翻天覆地的变化,取得了举世瞩目的成就,其中农业技术推广在农村经济发展和农民增收方面发挥着重要作用。农业技术推广
土地资源是宝贵而有限的,随着我国经济的繁荣与发展,土地市场也活跃起来,在此情况下充分合理利用每一寸土地成为国人的共识。城镇土地是城镇社会和经济发展的基础,其利用水平
结合市场经济的实际环境来对我国企业环境会计信息披露中所出现的问题进行思考与探究,以此来寻求更具价值的解决办法和相关建议,期望能够更好地帮助企业将环境保护与经济发展
信息与火力一体化的指挥控制系统,是形成信息与火力一体化联合作战体系的核心,是生成一体化联合作战能力的关键环节。运用模糊综合评估的方法能对信息与火力一体化指挥控制系
当电机的供电电压呈非正弦时,利用传统电机等效模型分析能耗关系的方法因缺乏明确的物理意义而不再适用。针对上述问题,本文分析了电机等效模型的建立与适用条件,以及异步电
本文主要采用替代成本法从正、负两个方面评估了华南稻作区稻作农业多功能价值,并根据稻作农业的外部效益和市场经济效益的组合变动,应用补偿需求理论构建生态补偿标准量化模
<正>《面积的变化》这一课是苏教版数学教材六年级下册结合比例单元教学内容安排的一次实践与综合应用课,本课主要是让学生经历"猜测—验证—运用"的过程,自主发现平面图形按
三相异步电动机在我国工业领域所占比重很大,如何保持三相异步电动机稳定运行、如何提高其工作效率等问题一直是人们关注的重点,这对于能源节约和环境保护有着重大的意义。针