【摘 要】
:
当处于标签样本过少的情况下,节省标签所需的劳力是机器学习领域当中的一个非常重要的研究课题。为了获得一个有效的分类器,我们可以采用迁移学习来从相关的辅助域中迁移传递
论文部分内容阅读
当处于标签样本过少的情况下,节省标签所需的劳力是机器学习领域当中的一个非常重要的研究课题。为了获得一个有效的分类器,我们可以采用迁移学习来从相关的辅助域中迁移传递知识,也可以采取主动学习,查询最有信息的样本进行标记。然而,在许多实际应用中,现有的方法更加注重标签样本和专家在目标域中可用的情况。在本文中,我们考虑一个更具挑战性的设定,即标签样本和专家在目标域中均完全不可用。我们结合主动学习和直推式迁移学习,提出了一种高效的新算法,称为基于主动源域查询的直推式迁移学习(TTCALS),可以充分的利用源域中的知识。我们的主要想法是在源域中按类别选择信息量最高的样本,与此同时学习共享子空间以从源域迁移更多已知的信息,上述的两个步骤最后都集成到了一个统一的框架中。我们又考虑了主动查询中的代表性和信息量,结合了目标函数中可能存在的过拟合现象,提出了基于代表性和信息量的直推式迁移主动学习算法(RUTTAL)。本文主要的贡献有以下四点:1)我们研究了一个具有挑战性的问题设置,就是标签样本仅存在于源域中,并且在目标域中没有可用的标签专家。通过从源域选择和标记少量最具代表性和信息量的样本,可以直接预测目标域的未标签样本。2)在标签样本和标签专家在目标域上都不可用的情况,这是首次尝试将主动学习应用到直推式迁移学习的工作。源域中的样本由专家主动选择并分配标签。直推式迁移学习算法学习源域和目标域之间的共享子空间。基于这种方法,域之间的知识基本上可以转移。3)此外,上面我们首先提出了一个基本的基于主动源域查询的直推式迁移学习算法(TTCALS),我们还考虑了目标函数的正则化项和主动查询中的代表性,综合提出了基于代表性和信息量的直推式迁移主动学习算法(RUTTAL)。4)通过在情感分析的典型数据集上的测试可以得出,本文提出的基于主动源域查询的直推式迁移学习算法(TTCALS)以及基于代表性和信息量的直推式迁移主动学习算法(RUTTAL),相较于其他的比较方法可以建立精度更高的主动迁移学习模型,并且可以大大节省人类标签的劳力。
其他文献
秦巴山区镇巴县地质环境复杂,岩性复杂多变,地质灾害受地域影响较大,再加之区内降雨充足,灾害发生的概率进一步增加,滑坡灾害尤为突出,本文以镇巴县幅区内灰岩地区为研究区域,区内滑坡的变形破坏特征和稳定性为研究内容,主要研究方法和成果如下:(1)通过实地野外地质详查,将研究区滑坡分为岩质滑坡和土质滑坡,并将研究区70个野外调查点作为样本,通过统计结果可见顺向坡数量最大,其次为逆向坡、顺斜向坡,逆斜向坡相
随着我国高校毕业生人数逐年攀升,越来越多的毕业大学生涌入就业市场。据麦可思研究院发布的《2016年中国大学生就业报告》显示,我国大学毕业生的离职率较高。其中,半年内曾有过离职经历的大学毕业生员工超过三成,2015届大学毕业生毕业半年内的总体离职率甚至高达34%。为何在激烈严峻的大学生就业形势下却依然存在大学毕业生员工的高离职问题引起人们的深思。在客观上因供需市场信息不对称,造成错位对接,难以做到人
目的研究“核HO-1”是否降低缺氧损伤后的体外血脊髓屏障的通透性。方法培养人脑微血管内皮细胞(HCMEC/D3)和人脊髓星型胶质细胞(HA-sc),并将HO-1C?23质粒和空载质粒分别转染
目的:探讨冠状动脉旁路移植术同期冠脉内膜剥脱术(coronary artery bypass graft+coronary artery endarterectomy,CABG+CE)治疗冠状动脉慢性完全闭塞的患者的安全性和有效性
吴稚晖的人生几乎与整部中国近现代史相重叠,历经该时期许多重大历史事件及晚清到民国承接期的诸多历史转折点,最终去往台湾,是一位复杂而独特的历史人物。他的人生历经晚清
数据中心的发展带来了巨大的计算资源的同时也带来了巨大的能耗问题,解决数据中心能耗问题的前提是对数据中心的功耗建立可靠的模型,本文从近似计算应用入手,使用关键循环识
目前,随着我国电力设备改造政策和新能源政策的逐步推进,风电、光伏等可再生能源大量并网,给配电网安全稳定运行带来不确定性,并造成电压越限等一系列隐患。由于依靠传统联络开关的网络重构,存在受到开关动作延迟、冲击电流损坏器件、经常动作缩短器件寿命等问题的约束,不能完全符合重要负荷不间断供电的要求,也使可再生能源的渗透率无法进一步提高。柔性开关(Soft Open Point,SOP)是一种新型的电力电子
在急剧变化的晚清时代,不少仁人志士都在为国家、民族的命运殚精竭虑。作为光绪年间先后任监察御史、书院院长、大学堂总教习的屠仁守也在思考着国家未来的走向。其实践在卫
教材是实现教学的重要工具,数学问题是数学教材中重要的组成部分,而问题设置的情境对学生的发展发挥重要作用,可以激发学生学习数学的兴趣,引导学生思考,提供学生运用数学解决现实世界问题的机会,同时为提升学生数学素养提供路径。故本研究对初中数学教材(北师版)中问题情境设置的现状进行实证分析,以期促进教材质量的提升,加深教师对教材的认识。基于此,本研究确定了三个研究问题:一是初中数学教材(北师版)问题情境类
近些年在我国精神类疾病呈逐年高发态势,经颅磁刺激技术作为一种非直接接触的无创治疗精神类疾病的方法得到了极大普及。目前进颅磁刺激治疗是由医生手动引导下实现的,而规划治疗与选择治疗靶点均需医生具有丰富的临床经验,如果精神科医生的工作经验不丰富,在磁刺激治疗中会遇到较多困难;除此之外,因为治疗的时间比较长,再加上刺激线圈较重,即便是医生的工作经验很丰富,也会受到疲劳因素的影响,而产生抖动,使得线圈与预设