客户端个性化信息搜索服务研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:hongshu16
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web信息的爆炸式增长,如何快速、准确地从浩瀚的信息资源中寻找到所需信息已经成为困扰人们的一大难题。传统搜索引擎技术满足了人们一定的查询需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同兴趣爱好的用户个性化需求。个性化信息搜索服务就是针对这个问题提出来的。个性化信息搜索服务是指针对不同用户的不同特点提供不同的服务策略和服务内容,其实现方式可以在客户端,也可以在服务器端。本文主要研究的是客户端个性化信息搜索服务。本文讨论了一般搜索引擎系统的结构和工作过程,阐述了实现搜索引擎的各个关键技术,提出了下一代搜索引擎即个性化搜索引擎的定制服务的发展过程,讨论了个性化信息搜索服务定义、分类及其特点,以及客户端个性化搜索引擎体系架构和个性化相关算法等。用户兴趣的获取技术可分为被动获取和主动获取两种方式。本文提出的基于模板的用户个性化搜索把两种方式结合起来,其中建立初始用户兴趣描述的实现属于被动获取方法,主要是利用用户对模板的信息输入来获取用户的兴趣信息,从而初步获得用户的兴趣模型;收集用户反馈信息的实现属于主动获取,它不需要用户亲自输入自己感兴趣的内容,而是从用户平时的网络浏览习惯去主动发现用户的兴趣,进一步优化用户兴趣模板。本文实现的基于用户隐式信息的个性化搜索也是属于主动获取方式。根据目前个性化信息搜索服务的分类特点,针对存在局域网的网络,本文提出了一种三级用户兴趣结构模型。即在客户端和局域网服务器端同时实现个性化处理,这样可以让用户体验更完美的个性化信息服务。另外,针对目前描述用户兴趣用一元组的向量描述方法,本文提出了新的用户兴趣描述方法。第一种是用森林结构来描述用户兴趣,这样,用户兴趣的各方面会得到更合理的表述。还有一种是根据前面提出的三级兴趣结构模型引申出的多级结构来描述用户兴趣。最后,本文在Windows平台上使用Java语言以及Lucene工具包,开发了一个基于Lucene的全文搜索引擎实验原型系统,在此基础上实现了本文提出的几种个性化信息服务的研究思路。针对目前还没有一种搜索引擎反馈给人们按日期排序的新闻搜索结果的状况,本文设计的新闻排序搜索系统具有现实的意义。最后进行了全文总结并提出了进一步研究工作的设想。
其他文献
随着手持移动设备的在日常生活中的日益普及,利用其获取Web网页信息的应用模式迅速发展。目前互联网绝大多数网页是针对桌面计算机的显示屏幕分辨率设计的。手持移动设备的屏
网络技术的不断发展,需要利用数据挖掘技术从大量的网络信息中挖掘出对人们有用的资源。目前比较成熟的信息推荐技术是采用面向网络信息来解决以上问题的。但是,这种方式很难
随着计算机网络技术的飞速发展,信息安全越来越受到人们的重视。如何保证网络上数据的保密性、可信性、完整性、不可抵赖性已经成为网络安全领域的主要课题。公钥基础设施(PKI
P2P(Peer-to-Peer)技术的大量应用对目前的网络应用提出了巨大挑战,它的Peer端平等性,正在带来因特网的革命,而基于P2P网络的搜索效率研究是推动P2P网络进一步发展的关键问题
Web应用程序因其易于部署维护和成本低的特点,近年来在电子商务、电子政务等领域应用广泛。Web应用程序迅速发展,从只有静态内容发展到拥有众多动态内容,成为企业、政府发布信息
小波分析(Wavelet Analysis)是当前应用数学和工程学科中一个迅速发展的新领域,与傅立叶分析(FourierAnalysis)相比,小波分析是空间(时间)和频率的局部分析,因而能有效地从信
本课题来源于综合电子设备仿真测试与故障注入系统的子课题,开发了基于VxWorks平台的1553B总线测试系统。论文着重阐述对虚拟设备、物理I/O模块、模块间通信协议的研究,详细
在政府向“柔性家长制”转换以及企业向“弱利他主义”转变的趋势下,政府和企业在数据管理与服务方面正面临着很多挑战。首先,政府、企业部门需要建立一个统一的数据视图,以便决
随着计算机、网络、通信技术的飞速发展,各种形式的数字图像呈爆炸式增长。图像分类技术在对这些海量数据进行高效分类及管理上具有重要研究意义。在图像分类中,需要大量的标
随着视频编码技术的发展,高清视频逐步走进了千家万户,全面高清化的需求日益突出。对于数字电视而言,大部分家庭已经开始使用支持H.264/AVC解码的高清机顶盒,而有部分家庭仍