【摘 要】
:
机器学习的目的是基于训练数据进行模型学习,从而利用学习到的模型对未知样本进行预测。对于分类问题而言,传统的监督学习将现实世界中的一个样本对象视为一个“示例&标记”对,其中示例就是用来描述样本的特征,标记即该示例所对应的类别标签。传统单标记学习假设每个样本对应单一的...、明确的...类别标记,即训练样本集中的每个示例仅与一个类别标记相关联。但现实应用中的很多机器学习场景并不符合上述的两个假
论文部分内容阅读
机器学习的目的是基于训练数据进行模型学习,从而利用学习到的模型对未知样本进行预测。对于分类问题而言,传统的监督学习将现实世界中的一个样本对象视为一个“示例&标记”对,其中示例就是用来描述样本的特征,标记即该示例所对应的类别标签。传统单标记学习假设每个样本对应单一的...、明确的...类别标记,即训练样本集中的每个示例仅与一个类别标记相关联。但现实应用中的很多机器学习场景并不符合上述的两个假设:(1)一个样本对象有可能会对应多种语义信息,即一个示例对应多个标记;(2)训练集中的样本可能不具有明确的类别标记。基于这两个问题,多标记学习以及偏标记学习这两种学习范式近些年来受到越来越多研究人员的关注。多标记学习与单标记学习的区别在于样本在标记空间的多义性,即每个样本示例可以与一个或者多个类表标签相关联。近年来,多标记学习得到越来越多研究者的关注,大量的多标记学习方法被提出,但由于多标记学习在标记空间的复杂性,现有方法很难再各项评价指标上都能够达到很好的效果,为了更好地处理多标记分类问题,本文提出了两种多标记学习算法。首先针对多标记学习中不同样本之间的差异性,我们提出了一种基于局部自适应6)近邻的多标记学习算法,该算法考虑到数据集不同区域的样本之间差异,使得在运用6)近邻算法解决多标记问题时能够获得更准确的结果。另外针对多标记任务上的标记之间的差异性,我们提出了一种基于标记重要性分析的多标记学习方法,我们考虑到多标记任务中不同标记的可预测性和影响力的差异,提出一种确定标记重要性的方法,并且将标记重要性分析应用到了两种多标记分类方法里,实现了比基准方法更优的结果。偏标记学习场景下样本集的每个示例也可以与多个类别标记相关联,但在这些标记中有且仅有一个为该示例的真实类别标记。已有方法解决偏标记学习问题的主要思路是通过标记消歧实现的,即在学习过程中去区分每个示例的候选标记集中的真实标记和无关标记。近年来,基于特征空间相似性的偏标记学习方法被提出,该方法利用特征空间和标记空间的平滑性实现标记消歧。但是已有基于特征相似性的偏标记消歧算法都是采用的固定相似图,在数据集存在噪音样本的情况下,这种方法的分类效果不能得到保证。基于这个原因,本文我们提出了一种基于自适应相似图的偏标记消歧方法,该方法将标记消歧、相似图优化和模型训练在同一框架内完成,在处理实际应用时具有更好的鲁棒性。本文分为五章。第一章介绍多标记学习和偏标记学习的基本概念,并作出已有相关方法的综述和有待解决的问题。第二章和第三章分别提出两种不同的多标记学习方法。第四章提出一种新型的偏标记学习算法。第五章对本文工作进行了总结,并作了对未来工作的展望。
其他文献
文化产业作为本世纪公认的最有发展潜力的产业之一,已逐渐成为我国经济增长的新引擎。当下,注册制在我国资本市场并未落实,我国企业若要上市只有IPO上市和借壳上市两种方式。从历史经验和现实情况来看,国际出版传媒行业往往被国家或者大型财团掌控,行业竞争十分激烈。我国的出版传媒企业若想在这种环境下突破自我,做大做强,就必须通过资本的力量来实现战略转型和规模发展,于是我国的出版传媒企业纷纷将视线聚焦在IPO和
2002年,我国开始试点粮食直接补贴政策,随后迅速推向全国。该项补贴政策实施以来,我国粮食产量每年都在不断增加,同时,农民的收入水平也有了大幅度的提高。但是,当前我国的粮食生产也面临着一些新的问题与挑战,比如:粮食生产效率不高、粮食生产方式有待优化、粮食补贴制度不够完善等等。我国粮食直接补贴额度每年都在不断上涨,粮食直接补贴政策在促进粮食产量提升方面是否起到了关键性的作用?如果发挥了作用,那发挥作
目的:通过研究患者上呼吸道CT图像上解剖学特点,探讨成年男女患者甲状软骨宽度的分布情况,分析其与患者年龄、性别、身高和体质量等参数的关系,为临床喉罩型号选择提供解剖学
近几年,随着信息科技的发展,云计算作为一种新的虚拟化解决方案,可以将现有的计算、存储和网络等物理资源进行整合,形成统一的资源池并以弹性的、即时的方式通过互联网提供给
随着移动机器人的广泛应用,其精确定位技术作为该领域的核心技术之一逐步成为了研究热点。依赖单一传感器的定位,无法满足复杂环境下精确定位的需要,因此多传感器信息融合的定位方法成为当今移动机器人位姿估计的主要方法,目前应用较多的是将视觉信息和惯导信息进行融合实现位姿精确估计。在视觉-惯导里程计研究中,图像几何信息通常采用特征点匹配得到,但在低纹理场景中提取的有效特征点较少,容易导致定位不准。在人造环境中
并联机器人/机构结构复杂,具有承载能力强、累积误差小、精度高等优点,得到广泛关注,其中以三自由度为代表的少自由并联机器人的研究成为近年来的研究热点。末端位姿是反映并
目的:抗胃壁细胞抗体(Parietal cell antibody,PCA)是自身抗体家族重要成员,是机体免疫系统功能异常,B淋巴细胞针对胃壁细胞表面的H+/K+-ATP酶发生免疫反应分泌的一种免疫球蛋
多智能体网络系统的一致性是复杂系统的主要动力学行为之一,也是复杂系统协调控制的根本问题。随着多智能体网络系统一致性问题在机器人协作、无人机编队控制、电力网络、传
目的探究取自SD大鼠中,新生幼鼠背部真皮组织体外培养的皮肤成纤维细胞(skin flbroblast,SF)经血管紧张素Ⅱ(angiotensinⅡ,AngⅡ)诱导转化为皮肤肌成纤维细胞(skin myofibro
目的:本研究从中医学“阴阳互济”的理论出发,选用张景岳创立滋补肾阴的代表方剂左归丸和温补肾阳的代表方剂右归丸,通过研究左、右归丸对PMOP模型大鼠糖、脂代谢和能量代谢