【摘 要】
:
随着通用搜索引擎技术发展的成熟,个性化、智能化逐渐成为了搜索引擎技术的发展方向。个性化搜索引擎的重点是用户兴趣模型的创建与更新,因为用户兴趣模型的质量决定了个性化
论文部分内容阅读
随着通用搜索引擎技术发展的成熟,个性化、智能化逐渐成为了搜索引擎技术的发展方向。个性化搜索引擎的重点是用户兴趣模型的创建与更新,因为用户兴趣模型的质量决定了个性化服务的质量,很多个性化处理过程都建立在用户兴趣模型的基础上。因此,如何建立高质量的用户兴趣模型,并将其应用于查询结果的优化,是一项具有实际应用价值的研究课题。本文针对现阶段个性化搜索引擎面临的一些问题,指出基于传统TF-IDF算法建模的不足,将内容分析和行为分析相结合,改进了TF-IDF算法,并以此为基础,利用用户手工定制建模技术与自动用户建模技术,设计了一种创建用户兴趣模型的方法;针对常用的基于用户行为和用户主题向量的更新算法存在的问题,即不能全面准确获取用户兴趣信息的问题,将用户群组中的兴趣信息作为兴趣补充,引入用户对检索结果反馈信息,提出了一种兴趣模型更新算法,并以实验证明了该算法可以有效提高兴趣模型的全面性和准确性;基于上述模型,论文进行了查询结果优化方法的研究,针对原查询扩展方法只考虑点击次数而不考虑被点击检索结果的质量的问题,通过进一步计算候选关键词权值,改进了基于用户兴趣度的查询扩展方法,并针对原个性化排序方法忽略了用户对于检索结果的态度不确定的问题,通过引入用户反馈信息计算检索结果与查询的相关度,改进了基于历史查询的个性化排序方法,实验结果表明上述改进方法使检索结果序列更接近用户点击序列;最后,本文将上述研究成果应用于个性化搜索引擎系统的设计与实现,通过系统测试证明了上述方法的有效性。
其他文献
网络流量异常检测及分析在网络管理及网络安全领域具有重要意义。近年来,国内外网络流量异常检测与分析的研究方法主要是采用基于特征/行为的研究、基于流挖掘的研究和基于统
目的研究养阴清咽颗粒的质量控制标准。方法采用薄层色谱法对颗粒中玄参、桔梗进行定性鉴别,并用高效液相色谱法对颗粒中的金银花进行含量测定。结论薄层色谱分离清晰,阴性无
随着课程标准修改工作落下帷幕,苏教版小学语文教材的修订工作已经全面开展。2015年秋季,部分年级已经使用新版教材。通过比较不难发现,新版教材在文章体裁和文体类型的选择
随着我国资本市场的不断发展壮大,如何科学合理地评价基金绩效已成为基金管理公司、投资者及监管部门深入研究的重要问题。现代证券投资基金绩效评价理论主要是从基金创造收
历史教学语言是历史思维的主要载体,具有鲜明的历史学科特色,在历史教师传播人类文明,培养学生历史思维品质,启迪学生智慧方面有着举足轻重的作用。本文试从袁腾飞老师的教学
医院的园林绿化对植物配置有着特殊的要求。本文在调查了宁夏医科大学附属医院的绿化现状后,结合园林绿化的原则与本地植物资源的状况,分析了宁医大附院植物种类选择和植物搭
过度包装造成的资源浪费、包装废物对环境造成的“白色污染”等现象引起社会各界越来越关注包装和有关包装的法律法规。我国目前还没有专门规范包装活动的法律。中国包装联合
近年来,我国非政府组织得到迅速发展,然而我国目前正处于社会转型时期,市场经济体制的不完善、法制的不健全、责任机制的不到位、道德观的扭曲和错位加之现行管理体制的弊端,
数量经济学是我国所特有的一门学科,是数学化和定量化的经济学,作为我国经济学的新兴学科,具有鲜明的交叉学科特征和其他经济学科难以替代的优势.近年来我国数量经济学发展迅
目的探讨苦碟子药理作用,对其临床应用效果进行分析。方法对苦碟子治疗的临床资料进行回顾性分析,对苦碟子的药理作用和临床应用效果进行观察。结果碟脉灵等苦碟子注射液,主