机器学习中的标记增强理论与应用研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:JK0803_chenjiehua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标记端多义性是当今机器学习的热点问题。多标记学习中,每个样本都被赋予一组标记子集来表示其多种语义信息。然而,标记强度差异现象在多义性机器学习任务中广泛存在,而既有多标记学习研究中普遍采用的相关/无关两个子集的逻辑划分法几乎完全忽视了这种现象,造成学习过程中不可避免的信息损失。针对这一突出问题,有必要用一种称为标记分布的标注结构来代替逻辑标记对示例的类别信息进行描述。标记分布通过连续的描述度来显式表达每个标记与数据对象的关联强度,很自然地解决了标记强度差异的问题,而在以标记分布标注的数据集上学习的过程就称为标记分布学习。由于描述度的标注成本更高且常常没有客观的量化标准,现实任务中大量的多义性数据仍然是以简单逻辑标记标注的,为此本文提出了标记增强这一概念。标记增强在不增加额外数据标注负担的前提下,挖掘训练样本中蕴含的标记重要性差异信息,将逻辑标记转化为标记分布。本文对标记增强进行研究,主要工作包括:构建标记增强基础理论框架。该理论框架回答了以下三个问题:第一,标记增强所需的类别信息从何而来?即标记分布的内在生成机制;第二,标记增强的结果如何评价?即标记增强所得标记分布的质量评价机制;第三,标记增强为何有效?即标记增强对后续分类器的泛化性能提升机制。理论分析和实验结果验证了标记增强的有效性。提出一种面向标记分布学习的标记增强专用算法。以面向标记分布学习的标记增强为目标专门设计的算法十分重要,其关键是如何设计能够充分挖掘数据中隐藏的标记信息的优化目标函数。因此,本文提出一种面向标记分布学习的标记增强方法GLLE。该方法利用训练样本特征空间的拓扑结构以及标记间相关性,挖掘了标记强度信息,从而生成了标记分布。实验结果验证了GLLE对逻辑标记数据集进行标记增强处理后使用标记分布学习的有效性。标记增强在其他学习范式上的应用。本文提出了基于标记增强的多标记学习方法LEMLL,该方法将标记增强与多标记预测模型统一到同一学习目标中,使得预测模型可以在更为丰富的监督信息下进行训练,有效地提升了学习效果。本文提出了基于标记增强的偏标记学习方法PLLE,该方法利用标记增强恢复候选标记的描述度,使得后续的学习问题转化为多输出回归问题。在多标记数据集和偏标记数据集上的实验结果显示,相较于对比算法,基于标记增强方法取得了显著更优的表现。
其他文献
超材料(Metamaterial)是一种由亚波长尺度基本结构单元在空间中按照某种特定方式排布而成的人工材料,通过设计单元结构及其分布模式可实现很多奇特的物理现象,例如负折射、完美成像和电磁隐身等。平面型的超材料又称为超表面(Metasurface),由大量的平面化基本单元构成,其对电磁波的调控可通过设计单元幅度、相位、极化等物理参数实现。2014年,东南大学崔铁军教授等将超表面与数字信息相结合,提
随着智能终端的普及,移动互联网和物联网业务迅猛发展,无线用户请求呈现出高密度、时延敏感、高移动性以及多样化等特点,推动了移动网络向第五代移动通信系统(5th generation mobile communication systems,5G)的革命性演进。相比于第四代移动通信系统,5G能够同时大幅改善网络的用户体验速率、峰值速率、连接密度、传输可靠性和时延等性能,全面满足多样化的场景和业务需求。
木-混凝土组合梁是由底部的木梁和上部的混凝土板通过剪力连接件组合形成的受力构件。这类结构形式相较纯木梁受弯体系具有承载力高、抗弯刚度大的优点,并且在隔音、防火和防振等方面较纯木结构有着明显的优势。与钢-混凝土组合结构中钢梁与混凝土板可以实现“完全组合作用”不同,木-混凝土组合结构受制于材料特点,其连接件的抗滑移刚度较低、界面相对滑移较大,呈现出相对较弱的“部分组合”性能。这种特点导致木-混凝土组合
妊娠期糖尿病(Gestational diabetes mellitus,GDM)在全球范围内发病率逐年上升,带来了严重的经济及公共卫生问题。相对于快速增长的发病率,GDM的临床治疗药物却十分有限。而近几年,微生态分子技术的发展使得人们对肠道菌群研究更为深入,提出将肠道微生物作为GDM医学营养治疗的新靶点。菊粉作为一种益生元,由于其特殊的β-(2,1)-糖苷键结构,使得菊粉在口腔、胃、小肠中均不会
过渡金属化合物属于强关联电子材料,其中自旋、电荷、轨道以及晶格等自由度之间相互耦合,产生了多种竞争相和丰富的物理性质,比如高温超导体;庞磁电阻;电荷/轨道有序以及多铁性等。其中,同时具有磁性和铁电性的多铁材料,尤其是当它们相互耦合时,不仅具有重要的基础物理的研究意义,同时也蕴藏着潜在的应用价值。一方面,虽然在过去的几十年里,科学家们在多铁领域取得了很多重要的研究进展,但是在寻找具有理想性质的材料方
本文针对波形钢腹板组合曲线箱梁桥的力学性能,主要研究两大内容:一是波形钢腹板组合曲线箱梁的弯曲、扭转和畸变性能;二是曲线箱梁中波形钢腹板的剪切屈曲和抗剪强度。本文采用理论分析、有限元数值计算和模型试验的方法,考虑波形钢腹板的结构特点,对上述内容进行研究。主要的研究工作和成果如下:(1)根据曲线箱梁的平衡方程、内力与位移之间的关系,并考虑波形钢腹板的结构特点和剪切变形,推导了波形钢腹板组合曲线箱梁的
随着对地观测技术不断进步和发展,电离层探测从地基单站小范围探测转变成地基空基相结合覆盖全球范围长时间连续性观测。不断涌现的新探测手段,推动了电离层相关科学理论的研究和发展,揭示了各种电离层现象形成的物理机制,加深了对地球空间的环境认识。电离层的研究成果不仅能提高我国北斗卫星导航系统的导航定位精度,还能为交通运输提供高质量导航定位服务。因此对电离层的研究具备重要的经济价值、实用价值和科学研究意义。电
第一章慢性胰腺炎后新发糖尿病的荟萃分析目的:3c型糖尿病(T3cDM)是一种与胰腺外分泌疾病相关的其他特殊类型糖尿病,慢性胰腺炎(CP)是其最常见的病因。本研究进行系统的文献综述,以评价CP相关糖尿病的流行程度、时间进程及分析相关协变量,为临床预防CP患者继发糖尿病提供依据。方法:通过系统地检索Pubmed、Embase及Cochrane三大数据库,以CP后发生新诊断糖尿病或接受胰岛素治疗的糖尿病
过渡金属化合物中的自旋、电荷、轨道以及晶格等自由度之间相互耦合,产生了丰富的物理性质,从而引起了研究者的兴趣。自从在铁磷族化合物中发现了超导电性以后,铁基材料迅速地发展成为凝聚态物理领域最热门的话题之一。最近,实验上发现一类新的准一维铁梯子结构BaFe2X3(X=S/Se)在高压下具有超导电性,为高温铁基超导体的研究开辟了一个新的分支。通常,在低维系统中,过渡金属离子之间相互作用会大大的增强电子-
作为电子系统中重要的接口模块,模数转换器(Analog-to-Digital Converter,ADC)被应用于各类电子设备之中。随着半导体制造工艺和集成电路设计技术的不断进步,针对数字集成电路的协同设计需求和生物医疗、音频电子设备以及能量采集系统等应用场景,低电压低功耗ADC逐渐成为学术界和工业界的研究热点之一。因此,对低电压低功耗ADC主要类型之一的Σ-Δ调制器进行研究,具有十分重要且深远的