【摘 要】
:
排序函数是信息检索系统的核心部分,这是因为排序函数直接影响着检索结果的质量。近年来,排学学习,即通过机器学习的技术构建有效的排序函数,成为信息检索、机器学习和数据挖
论文部分内容阅读
排序函数是信息检索系统的核心部分,这是因为排序函数直接影响着检索结果的质量。近年来,排学学习,即通过机器学习的技术构建有效的排序函数,成为信息检索、机器学习和数据挖掘等相关领域的热点问题。排序学习的方法通过收集标注训练数据,并使用机器学习技术拟合训练数据,从而得到有效地排序函数。在本文中,我们针这对现有排学学习存在的问题,提出改进方案。我们计划提出三个排学学习算法,分别解决排学学习中存在的相关性表示、跨领域学习排序和查询特征表示三个问题:1.我们提出一种新的相关性表示的方法——Tie关系,用于补充现有的相偏好数据。2.我们利用迁移学习的方法,使得排序学习的算法的可以利用现有的其他任务的标注数据构造目标任务的排序函数,从而减少了对于新任务所需要的了人工标注数量。3.通过使用伪反馈技术,我们改进了查询表示,从而使排序学习算法可以更好的处理不同的查询的多样性。
其他文献
本文在深入分析粒子群算法的缺陷及成因的基础上,引入了云理论、人工鱼算法,并提出扩张变异算子等方法,对粒子群算法进行改进,来提高算法的收敛速度和精度,有效克服了算法易
Domination问题是组合学中最具有代表性的一类判定问题,一般可分为:支配集问题,强支配集问题,独立支配集问题和联通支配集问题等。其中研究最多的是支配集问题。它和集合覆盖
在网络得到快速发展和应用的现代社会,代理签名的应用越来越广泛。例如:某总行授予所属支行签发电子货币的权利,让他们以总行的名义签发电子货币,而又不让他们获得总行的签发密钥
随着互联网技术和电子商务的飞速发展,各类企业都纷纷采用因特网和Web技术,将它们的主要服务搬到互联网上,以得到更强的自动性、更迅速的交易和更广阔的视野。SaaS(Software
随着数值计算技术的发展,使用数值模拟方法来制作引人注目的流体特效动画已在电影工业中成为一种趋势。在模拟计算中,小尺度的流体细节尤为重要,比如烟雾中的涡旋或是流沙中
我们生活在一个信息爆炸的时代,各行各业积累了大量的,甚至是海量的数据。根据世界知识产权组织的统计,专利文献含有世界每年发明创造成果的90%~95%,世界每年的申请量以100多
尽管文档分类作为一种知识组织方法在诸多场合有广泛的应用,但针对这类高质量数据的数据挖掘研究却不多。本文着重于利用文档分类结构的信息检索技术研究。对平行分类结构和
在自然语言中有大量非常规的语言学现象,如谚语,俚语,成语等,这些语言现象很难用标准的句法分析或者是传统的框架语义学等方式来解析。认知构式语法正是从特殊语言现象的分析
近年来随着城市化进程不断推进,人群密集的公共场所不断增加,公共安全问题成为公众关注的焦点。如何在地震、火灾等紧急事故发生时快速有效的组织人群疏散,最大程度的保障公
语义网是当前Internet技术的研究热点之一,其研究重点是如何把信息表示为计算机能够理解和处理的形式,并在此之上构建本体和推理规则,以实现基于语义的知识表示和推理。语义