面向博文搜索的用户行为分析技术研究与应用

来源 :东北大学 | 被引量 : 2次 | 上传用户:hezhimou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息的不断增长,博文成为Web2.0的重要应用,人们使用博文进行发表观点,书写生活等一系列活动。由于网络中蕴含着大量的信息,用户对博文搜索引擎的功能、搜索效果以及智能化程度有了更高的要求,希望搜索引擎能够提供更为准确并贴近其个性化需要的搜索结果。因此,分析用户搜索行为,及时了解用户的搜索意图,是十分重要且有现实意义的问题。本文在研究目前博文搜索特点和用户行为分析技术等相关内容的基础上,综述用户行为分析和不确定性推理过程中涉及的研究方法和开发技术,详细论述用户行为分析的具体步骤,给出兴趣度、博文属性向量和用户意图矩阵等便于表述用户行为模型的定义,细致描述面向博文搜索的用户行为模型构建方法。在综合考虑用户搜索博文的时间效应和点击效应的情况下,给出浏览度和点击度的定义,提出基于朴素贝叶斯分类器的用户兴趣度计算方法,在兴趣度计算过程中解决不确定性问题,并对该算法进行深入研究。通过利用用户行为分析技术,设计并具体实现一个用户行为分析原型系统,对系统的体系结构、数据流向、逻辑结构和数据库设计等进行全面分析,给出系统中重要模块的实现过程,并对用户行为分析原型系统进行测试,对测试结果进行分析。本文所研究并实现的用户行为分析技术目前正应用于博文搜索重排序原型系统,该技术从用户的角度出发,充分考虑到用户搜索的动作行为,是博文搜索重排序原型系统的重要组成部分,也是整个系统搜索结果能够贴近用户搜索意图的关键。
其他文献
语义Web作为当前Web的扩展,旨在使得Web中的信息具有语义,从而能够被计算机理解,便于人和计算机之间的交互与协作。本体是领域知识共享的形式化描述,语义Web的实现很大程度上
近几年来,随着生物信息学迅速发展,产生了大量的生物数据,对这些生物数据的研究和分析对于指导生命科学研究、揭示生命起源和进化的规律有着重大的意义。生物序列与生物序列
在过去的数十年中,关系数据库系统得到了极大的发展,而且被应用到人们生活中的各个角落。同时,人们对数据管理的需求,尤其是数据查找的需求不断增长。但是在这方面,关系数据
Web服务(Web Service)是一种基于XML的Web应用,是一种新的分布式计算模型。Web服务本身具有的一些很好的特性,如:易适应性、松耦合性、开放性、语言独立性、平台无关性等,使其
随着计算机技术的飞速发展和信息化的推进,全球的数据量正在以指数的趋势迅猛增长,而不断增长的数据集对数据查询提出很多新问题,对计算机内存的要求也越来越高,很多情况下,
移动Ad hoc是一种没有中心基础设施的情况下,由节点自组织形成的多跳无线网络,是近年来国际上的研究热点。目前针对移动Ad hoc网络的研究多集中在链路层、网络层和应用层,包
世界范围内,因为汽车数量快速增长加剧了交通事故的发生频率,引起人们对车辆安全的高度关注,而针对汽车辅助驾驶系统的研究越来越受到国内外的重视,由于道路环境下运动车辆的
博客是伴随Web2.0出现的一个典型应用,随着博主越来越多,博客页面的数量迅速增长。由于每个用户自身情况千差万别,面对Internet上指数增长的可用信息,人们越来越难找到自己想
随着多媒体技术和网络技术的迅速发展,视频作为一种主要的媒体类型已成为与人类工作生活密不可分的信息载体。庞大的视频数量和不断彭胀的用户群体急需要一种高效的组织视频
随着互联网的发展,商品的种类越来越多,商品的信息结构也越来越复杂,影响推荐系统性能的附加信息也随之增长。附加信息是指除评分矩阵以外的文本、属性、地理位置、时间等信