基于数据挖掘的高校图书馆个性化推荐服务的应用研究

被引量 : 5次 | 上传用户:gdw2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着商品的种类和数目越来越繁多,各网络购物平台相继推出商品推荐系统,实现了根据用户在网站上的历史购买记录、浏览记录等信息主动为用户推荐其可能感兴趣的商品。而高校图书馆馆藏书目的种类和数目也越来越多,读者在没有具体借阅目标的情况下,从图书馆借阅图书所花费的时间和精力也越来越多。在这样的背景下,本文提出了基于数据挖掘的高校图书馆个性化推荐服务的应用研究,通过借鉴网络购物平台的经验,为高校图书馆建立个性化图书推荐系统,通过分析读者的历史借阅记录、浏览记录等信息,为读者主动推荐其可能感兴趣的图书。课题以内蒙古工业大学图书馆为例,借助My Eclipse开发工具,详细研究了基于内容的推荐算法在高校图书馆个性化推荐服务中的应用。首先利用数据清洗、数据变换和数据规约三种数据预处理方法对原始数据进行了预处理,使数据更加规范化、更有利于规则的挖掘;预处理之后,借助中科院的ICTCLAS分词工具将图书名进行分词处理;然后利用TF-IDF方法计算每个分得的词的权重大小,将权重较高的词作为关键词来表示图书的主要特征;得到图书的关键词之后,将所有图书及其关键词一起构建向量空间模型(VSM);最后利用构建好的向量空间模型计算图书之间的相似度,并对相似度大小进行排序,将与读者借阅过的图书相似度较高的图书推荐给读者。为了使推荐结果具有多样性,还结合图书的出版社、作者和类别信息为读者进行推荐。在研究过程中,针对遇到的问题给出了相应的解决方法:针对书名的分词对中文分词程序进行了调整,主要表现为改进了用户词典,增加了停用词,使得分词结果的准确度更高,并且更加适合图书名称的分词;对词语权重算法TF-IDF针对短文本的应用给出了解决方法,使之对于图书书名中词语权重的计算更加公平、合理;另外,用三元组解决了构建向量空间模型时遇到的稀疏矩阵问题。最后针对本课题产生的推荐结果,利用目前比较成熟的评价方法进行了评价。为了使推荐结果更加直观,更方便读者使用,设计了系统界面,使得推荐结果以列表的形式在界面上显示,并且在每一条推荐结果后面注明了推荐理由,清晰明了,更容易被读者接受。
其他文献
目的调查2003年中国三甲医院糖尿病控制管理和晚期并发症的状况,并将结果与1998、2001年的结果对比,揭示糖尿病控制质量5年的动态变化。方法在中国30家三甲医院专科糖尿病中
现代商业综合体作为城市公共建筑的一个特殊分支,已成为每座城市经济、文化、交通、娱乐的综合载体。商业综合体是高度聚集的城市商业中心,它的出现取代了传统的单体购物中心
<正> 引言调压井的稳定性已有很多研究,然而,抽水蓄能工程或其它抽水系统,引出了调压井涌浪的一些还没解决的问题。1.传统的稳定性分析,仅应用于常规水电厂的水轮机运行情况,
新世纪的曙光已在地平线展现,青年干部作为跨世纪的一代领导者,承担着承先启后、继往开来的历史重任,责任重大。在此关键时期,青年干部特别是青年领导干部应确立“六种形象”
结合某自动化生产线的实际需要介绍了一种基于OPC的网络通信方法。
应用准移动闭塞系统和移动闭塞系统数学模型计算了总车距、列车间隔时间和线路运能,选取制动加速度分别为-0.63、-0.75、-0.85、-0.90m·s-2进行了仿真试验,分析了高速列车运
总结和评述了用于药物缓释体系中作为药物载体的可生物降解高分子材料的合成和应用,并对其研究发展前景进行了分析和展望.
本文将人工神经网络模型与河网水沙连续方程联系,建立了具有河网水沙运动特点的人工神经网络模型,赋予神经网络内部参数物理概念.该模型的特点是对河道地形要求不高,能够满足
随着社会安全意识的不断增强,以视频监控、智能分析、实时预警为手段的安防系统被广泛应用于社会的每个角落。但监控系统不间断的运行以及视频数据非结构化的特点,会产生海量
目前中学语文教学中仍存在一些弊端:有的课堂枯燥无味,尤其是小说、戏曲、文言文、散文等单元的教学,教学模式、方法单一,学生无兴趣学习;教师只重读、写训练,而忽视了听、说