【摘 要】
:
随着校园网建设的不断发展,校园网上的信息正以惊人的速度增长。如何迅速、准确地从大量的校园网信息中提取有用信息已经成为师生们关注的内容。目前,虽然已经有Google和百度
论文部分内容阅读
随着校园网建设的不断发展,校园网上的信息正以惊人的速度增长。如何迅速、准确地从大量的校园网信息中提取有用信息已经成为师生们关注的内容。目前,虽然已经有Google和百度等优秀的通用搜索引擎,但由于校园网的信息存在着保密性、局限性等特殊因素,通用搜索引擎并不能适应校园网内信息检索需要。由于通用搜索引擎没有考虑用户的兴趣,搜索结果无法满足不同用户的特定需求。结合校园网用户在信息内容查询的相似性和规律性,本文提出了基于用户兴趣模型的校园网搜索引擎,通过对Web日志和用户浏览行为进行分析挖掘,获取用户兴趣信息,建立用户兴趣模型,并不断对该模型进行更新和维护,使其能够更加准确地反映用户的兴趣需求。在用户兴趣模型的基础上通过修改网页权重值及添加用户修正参数的方法实现个性化索引结果排序。本文通过研究Web数据挖掘技术,对如何运用该技术进行用户兴趣挖掘做了深入的探讨,并分析了如何将用户兴趣挖掘的结果运用于校园网搜索引擎,以实现搜索服务的个性化。在对通用搜索引擎体系结构和构建搜索引擎关键技术研究的基础上,结合优秀开源框架Nutch和Lucene设计一个运用在云南大学校园网的搜索引擎框架,并且已经实现大部分功能。最后本文对系统进行了功能和性能方面的测试,实验结果证明该系统的性能良好,已能够基本满足云南大学校园网信息检索的需要。
其他文献
本文调查了南京市4种绿地类型中的13个绿地,从中选取近350个样本作为研究对象,运用美景度评价法对其进行美学价值评估。对1年中总体美景度值高的样本进行植物配置的分析。在
以补连塔煤矿2-2煤粗煤泥为研究对象, 分析了其煤质特征和理化特性, 采用TCS智能粗煤泥分选机对粗煤泥进行降灰、 降硫试验, 生产低灰精煤. 试验结果表明: 采用TCS对粗煤泥进
创新提出"瘦基站"形式,研究"瘦基站"形式对于覆盖黑点、难点建设的影响,从覆盖效果、投资情况、拆迁成本等方面分析,并与传统的铁塔覆盖方式进行综合对比,发现"瘦基站"建设方
针对预应力混凝土连续刚构桥发展现状及特点进行详细介绍,分析了大跨预应力混凝土连续刚构桥箱梁裂缝形成的原因,并提出了相应的防治措施,包括加强设计方案优化及模拟测试、
现代市场经济是信用经济。当前,在我国市场领域内,假冒伪劣、合同欺诈、虚假注册、逃避债务、偷税漏税、走私骗私等企业失信行为时有发生,初生的市场经济体制正遭受着严重的
20世纪中后期世界进入信息化与全球化时代以来,人类社会发生了越来越多的重大灾难事件。这些灾难与传统灾难不同,他们隐蔽性强、扩散性大、伤害力强,并且防不胜防地隐藏在现
抗震救灾精神是中华民族在共同抗击地震灾害的殊死搏斗中所形成的,它使我们看到了改革开放时代中华民族精神的一次伟大升华,与此同时也展现了全体中国人民抵御自然灾害时表现
目的:观察右美托咪定对老年全麻手术患者术后认知功能的干预效果。方法:对老年手术患者196例随机分为对照组和观察组,每组各98例。两组患者均静脉注射咪达唑仑、舒芬太尼、丙泊
新闻媒体是我国茶文化传播的重要载体,而强化新闻媒体在文化传播方面的责任感,对于推动新闻媒体树立良好的媒体形象以及提升文化传播成效具有重要意义。本文以充分发挥新闻媒
全世界萱草属(Hemerocallis spp.)植物现有14种。其中,中国约有11种。萱草属的新品种在世界各地的园林景观和绿化中具有重要作用。所以,萱草属种植资源收集保存、评价利用研