回归问题中的主动学习研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:ccbone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
回归是一类机器学习问题,带标签的训练样本对于回归模型的训练非常重要。而在某些实际应用中,原始样本很容易获得,但是给它们打上真实标签却非常困难,例如需要花费大量的人力、物力或时间。对于这类回归问题,应用主动学习可以有效地降低打标成本。目前的主动学习研究大多针对分类问题,针对回归问题的较少。本文考虑离线的基于池的主动学习回归问题,即给定一个样本池,如何从中选择尽可能少的最有价值的样本来打标,从而训练出性能尽可能好的回归模型。
  本文首先对比了有监督主动学习回归算法和无监督主动学习回归算法,并指出后者的一些优势;然后为无监督主动学习回归算法建立数学模型,并提出一种无需真实标签也能预测回归模型的精度的新指标;本文随后将有监督主动学习回归算法中的三个核心指标“分散度”、“代表性”和“信息量”迁移到了无监督主动学习回归算法中,并基于提出的数学模型和新指标为它们提供了理论解释;本文随后提出一种用于优化无监督主动学习回归算法中待打标样本集合的框架,该框架利用交替优化算法将多目标优化问题拆分为多个单目标优化问题;本文随后基于该框架,提出两种新的无监督主动学习回归算法iRDM和IRD,其中iRDM算法度量并融合了“分散度”和“代表性”指标,IRD算法不仅度量并融合了“分散度”和“代表性”指标,还针对线性回归模型度量了“信息量”指标,并融合到单次优化的目标函数中;本文最后在涵盖多个实际应用领域的12个公开的回归数据集上进行了大量的实验,实现了现有的经典主动学习回归算法和本文提出的两种新的无监督主动学习回归算法,使用“岭回归(Ridge)”和“基于径向基核函数的支持向量机回归(RBF SVR)”分别测试各算法在线性回归和基于核的非线性回归中的效果,从多个角度进行了数据分析,并进行了统计检验,验证了本文提出的两种新算法的性能和稳定性均优于现有的无监督主动学习回归算法,且在带标签训练样本很少时甚至优于有监督主动学习回归算法,还验证了使用本文提出的新算法为有监督主动学习回归算法选择初始的少量待打标样本能够有效提升有监督主动学习回归算法的性能。
  本文为无监督主动学习回归算法建立的数学模型和提出的预测指标能为后续的无监督主动学习回归算法的研究提供理论支持及新思路。本文提出的两种无监督主动学习回归算法合理地度量并融合了分散度、代表性和信息量三个核心指标。相比现有算法,它们能更有效地减少打标工作量,它们还能用于任何有监督主动学习回归算法中以提升初始回归模型的性能。
其他文献
随着全球经济的不断融合,企业的竞争是企业所在供应链与竞争企业所在供应链之间的竞争,因此,如何确保供应链中产品的质量符合要求并尽可能降低成本,是供应链中买方企业必须面对的问题。本文的重点是对供应商成本结构、买方的质量检查策略以及结合工期的质量检查激励机制进行分析研究。
  首先,本文对供应链质量管理的国内外研究现状和发展进行了论述,分析了供应链质量管理的特点和存在的一些问题。并在介绍供应链质量管理概念基础上,具体研究了如何设计供应链中的多属性契约,以确保供应商在规定时间内提供高质量的产品并降低买方的采
基于多自主体的持续监控系统由于具有监控策略灵活、覆盖范围广等优势,在海洋监测、城市巡逻等领域得到了广泛的应用,因此,开展基于多自主体的持续监控问题的研究具有重要的理论价值和潜在的实际应用价值。鉴于此,本文基于一阶及二阶多自主体系统,围绕持续监控问题中存在的监控不同重要性目标点、避免自主体之间的碰撞及避免自主体与障碍物之间的碰撞等不同监控需求开展了深入研究。全文主要研究内容包括以下三个方面:
  针对一阶多自主体一维持续监控问题,建立了更具一般性的加权目标函数模型。借助庞特里亚金极小值原理得到了自主体
【摘要】集传统黑板、计算机、投影机为一体的交互式电子白板以其独特的交互性,实现了师生、生生、人机之间的生动对话,让教师通过对资源的重新整合,达到优化教学设计的目的。本文通过小学语文课堂一个课例的教学设计,充分展示了电子白板在课堂教学中的交互性,高度融合教师的“教”和学生的“学”,旨在打造高效的教学课堂。  【关键词】交互式电子白板 小学语文  【中图分类号】G623.2【文献标识码】A 【文章编号
期刊
【摘要】童话是儿童文学中一种特有的体裁,它通常根据儿童的心理特点和成长需要,运用夸张的想象手法来构建满足儿童兴趣的故事情节,并反应一定的社会现状,对于促进儿童身心健康的成长发挥了巨大作用。为符合素质教育的发展要求,在小学阶段语文学科的实际教学过程中,越来越强调童话的有效运用,以促进小学生想象力的发展。本文结合童话故事在小学语文实际教学中的现状,通过深入分析童话的重要作用,对于如何运用童话给学生插上
期刊
【摘要】每次上课将事先做好的项目展示给学生,然后对项目进行分析:本项目应用了哪些工具;分析项目的制作步骤;项目中应用了哪些新知识点。这些新知识点将是本节课讲解的主要内容。因为《PHOTOSHOP CS》最大的特点是操作性强,所以要熟练掌握操作的每一個步骤。  【关键词】教学方法 课前备课 教材分析 讲好课程 上机辅导 课后总结  【中图分类号】TP317.4-4【文献标识码】A 【文章编号】209
期刊
【摘要】在新课改的背景下,互动式教学改变了传统的教学方法,有效的提高了高中政治教学的教学效率。本文从互动教学法的意义入手,简单探讨如何在高中政治教学中开展互动教学。  【关键词】高中政治教学 互动教学法 实践应用办法  【中图分类号】G633.2【文献标识码】A 【文章编号】2095-3089(2015)36-0169-01  在高中政治教学课堂中应用互动式教学法是指教师在教学过程要积极的与学生进
期刊
飞机除冰是影响航班冬季运行安全和效率的关键因素,除冰资源的合理调度是提高飞机除冰效率的主要途径。除冰资源包括除冰机位资源与除冰车资源,它们的调度分别由不同的参与者完成,如何对除冰资源进行合理的调度对提高飞机除冰质量与效率具有重要意义。
  本文采用启发式算法分别研究了机场除冰资源的分步式调度策略与集中式调度策略问题。首先研究了除冰机位资源分配问题,然后在此基础上研究了除冰车资源调度问题,实现了机场除冰资源的分步式调度策略;进一步,将除冰机位与除冰车协同考虑,最终实现了机场除冰资源的集中式调度策略。针
【摘要】近年来,随着新课改的不断深入,数学教学已转向以学生为中心,以学习方法为基础,从而更好的促使学生学习数学知识。本文结合教学经验,主要从课前预习、笔记记录、课程作业、合作学习和问题意识等方面入手,积极思考高中生数学学习方法的优化途径。  【关键词】高中数学 学习方法 策略探索  【中图分类号】G633.55 【文献标识码】A 【文章编号】2095-3089(2015)36-0185-02  进
期刊
区域防空反导作战是一种常见的现代战争形式,是各个国家作战体系的重要部分。区域防空反导作战经历了单个独立的防空作战单元、多个独立的防空作战平台和多个防空作战平台形成作战网络等三个阶段。针对基于平台的区域防空反导作战和基于网络的区域防空反导作战两种模式的作战流程,如何构建形式化的区域防空反导作战模型,并解决作战效能评估值无法量化的问题,是区域防空反导作战决策的关键问题,值得深入研究。
  本文深入剖析区域防空反导作战流程,分别构建基于平台和基于网络的区域防空反导作战OODA环以及区域防空反导作战模型,并
【摘要】也许这就是当下人们的共识,高中学生学习时间紧,任务重,阅读教学的主动探究,互动发展是严重的时间浪费。是主动探究,互动发展浪费了学生学习时间,还是没有利用学生的探究造成学生学习的低效浪费着学生的时间?本文所做的思考对这个问题予以了比较好的回答。  【关键词】主动探究 互动发展 策略思考  【中图分类号】G633.3【文献标识码】A 【文章编号】2095-3089(2015)36-0196-0
期刊