面向用户的信息过滤研究与实现

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:echoofstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的发展,尤其是Internet和网络技术的发展,极大的推动着万维网(World Wide Web)的普及。WWW深刻地改变着人们的生活和思维方式,Internet已经成为人们不可缺少的信息来源。然而Internet信息资源的高度无序性和不可管理性却给信息的使用者带来了极大的困难。由于现今的搜索引擎具有通用的性质,因此很难满足不同背景、不同目的和不同时期用户的查询请求。 用户的信息需求都具有个性化的特征,这些信息需求是相对稳定的、时间相对长久的,然而会随着时间的变化而不断变化的。自然而然,用户期待着能够适应个性化信息需求的信息服务软件的出现。 针对用户个性化信息服务这个特定的需求,本文目标就是开发出一种能够更加准确地获取WWW上的信息资源的工具。本文主要思路是利用用户兴趣模型、用户背景知识对信息(该信息来自于目前比较流行的搜索引擎)进行过滤,然后把过滤后的信息提交给用户,再根据用户的相关反馈对用户兴趣模型进行修正以改进信息提供的满意度。本文的主要工作有:①合作实现了一个原型系统;②采用最大概率算法,实现对中文文本的切词;③提出了一种描述用户兴趣类的描述模式:把用户的兴趣描述为一个n元组:C=(C1,C2,…,Cn);其中每个Ci表示用户的一个兴趣方向,Ci=(Ip,In,Iq),其中Ip={(t1,w1),…,(tn,wn)}In={(t1,w1),…,(tn,wn)}分别为用户兴趣方向中相关网页集和不相关网页集的特征向量,我们分别称之为吸引因子和排斥因了;Iq={(t1,w1),…,(tk,wk)}为用户的兴趣方向关键字向量,我们称之为查询。④利用向量空间模型(Vector Space Model)进行网页文档表示,然后利用线性过滤器对网页文档进行过滤。⑤建立用户的相关反馈,对用户兴趣模型进行动态的修改和更新。 本文的创新点:主要提出了一种描述用户兴趣的描述模式,并在该基础上利用相关反馈对其进行了修正和更新。进一步的研究工作有:第一,对于吸引因子、排斥因子(Ip,In)的选取方法还可以尝试其它的一些方法,这样有可能提高网页的过滤精度;第二,用户兴趣修正模型中的参数α,β,γ作为用户兴趣学习率,还有待于进一步的进行实验,使其更加的适应用户的兴趣变化曲线。
其他文献
目前,随着网络规模不断扩大,IP地址管理不可避免的愈加复杂。为了解决这一问题,网络管理员有必要建立规范的IP地址分配表、IP地址和硬件地址(MAC)登记表,并且做到实时监控。
数据挖掘在各个领域中有着广泛的应用前景,是进行数据分析的重要工具。 企业在使用数据挖掘时,面临应用的分布性和对大数据集的挖掘需求这两个应用方面的问题。此外,还有
本文讨论数据挖掘中聚类的相关概念、技术和算法,在对常见聚类算法进行评价的基础上,针对密度聚类的参数选取问题,提出了一种动态参数解决方案。 目前已提出的聚类算法中,
目前的Web服务面临着诸如如何按照服务的功能进行服务的查找和如何将多个服务进行组合以完成特定的业务逻辑等新的课题。而作为Web服务技术的关键之一,服务发现对实现这些课
由于铁路沿线对信号电源的稳定性要求比较高,所以,铁路信号电源系统采用“自动闭塞”和“电力贯通”双电源冗余供电。双电源设备是否能够正常工作,是关系到铁路运输安全的重
随着计算机网络的普及和发展,网络安全越来越成为人们关注的焦点,成为计算机网络领域的亟待解决和发展的重点。为了加强网络安全,世界各国提出了众多解决方案,PKI等安全体系
教学管理方式的改革是教学改革过程中的一个极其重要的环节,对教育教学改革的深入开展具有重要的作用.本文论述教学管理信息系统的设计、开发和应用过程,阐明了教学管理信息
工作流管理是近年来计算机应用领域中发展最为迅速的技术之一,已成为当前IT领域的一个研究热点。它的特点是使处理过程自动化,使人与人之间,以及人与应用工具之间协调工作,以
随着移动学习的不断发展,移动直播系统被越来越多的人所接受与使用,它充分发挥了移动学习的移动性、便携性和无限性等特点,让用户可以充分享受移动学习的乐趣,并在学习中,可以和教
本文针对服务器负载重、主干网络传输压力大、服务价格昂贵、不能满足大量用户的需求的问题,提出了基于P2P的媒体服务思想,对基于P2P架构的应用层组播协议进行了理论研究和仿真