开放环境下多示例学习与异常检测研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:chen95127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是人工智能的核心研究领域之一,是实现智能化的根本途径。传统机器学习通常假设数据独立同分布,并需要足够多的标记数据以获得较好的学习器。随着机器学习技术向更多应用领域不断拓展,越来越多的学习任务面临更为真实的开放环境,具体表现为数据非独立同分布,标记数据稀少等特性。本文对开放环境中的多示例学习和半监督异常检测问题进行了研究,主要取得了以下创新成果:1.提出了一种对关键示例漂移不敏感的多示例学习方法MIKI(Multi-Instance learning with Key Instance shift)。传统多示例学习方法通常假设数据独立同分布,对分布漂移的研究相对较少。本文提出一种对关键示例漂移不敏感的多示例学习方法MIKI,该方法首先学习关键代表示例,基于关键代表示例构建能同时刻画示例包信息和分布漂移的特征表示,通过学习权重缓解训练数据和测试数据之间的分布差距。实验结果表明,本文方法显著优于其他方法。2.提出 了一种半监督异常检测方法 ADOA(Anomaly Detection with partially Observed Anomalies)。传统异常检测大多关注于监督和无监督学习,对同时考虑少量异常标记和大量未标记数据的研究较少。本文方法对少量异常样本进行聚类,对大量未标记样本基于其隔离程度和与已知异常的相似度进行综合评价,从而分离出潜在异常和可靠正常样本,再通过加权训练分类模型。实验结果表明,本文方法在半监督异常检测任务中,性能显著优于其他对比方法。
其他文献
本文以电网动态谐波为研究对象,将人工蜂群算法应用于电网动态谐波估计中,提出了一种基于混沌改进人工蜂群算法的电网动态谐波估计方法。首先针对人工蜂群算法的“早熟”问题
在现实机器学习任务中,不同类别的误分类代价往往不同,为此以最小化总体代价为目标的代价敏感学习成为一个重要研究分支。考虑到在现实任务中获取精确的误分类代价往往很困难
作为我国主要的动力煤生产基地,大同煤田在煤系地层中存在着大量的煌斑岩侵入现象。煌斑岩侵入煤层后,会破坏可采煤层的完整性,减小煤层的可采厚度,降低煤层的可采储量,造成资源的浪费;受到煌斑岩侵入的影响,该区域的煤质会发生明显的改变,影响煤的价值;与此同时,煌斑岩侵入煤层还会影响矿井的安全生产,在煌斑岩侵入区域,煤的变质程度会增加,吸附的瓦斯量加大,工作面上隅角或者回风流中会瓦斯浓度超限现象;煌斑岩的强
随着我国西部建设的战略推进,高速公路建设成为中西部贯通发展的重要桥梁和纽带,在我国中西部地区二叠系、三叠系和泥盆系地层中广泛分布炭质页岩,由于炭质页岩层理发育明显
本文基于传播效果理论、信任理论以及风险社会放大理论三个理论视角,以青岛市民为研究对象,利用2019年青岛市民雾霾风险感知状况抽样调查数据,旨在研究青岛市民群体对雾霾风
在行人动力学研究中,研究行人的运动规律,可以为建筑设施设计、活动应急预案编写提供有力的理论支撑,保障公共安全。基本图是行人动力学分析中一个有效的工具。近些年来深度
随着国民经济的飞速发展和中厚板生产控制技术的不断提高,用户对厚板、特厚板的需求量不断的增加,对产品综合性能的要求愈加严苛,而中厚板在生产过程中,由于压下率有限,普遍
我国现行的沥青路面设计方法指导建设了大量沥青路面,为我国交通事业的发展作出了重要贡献,同时也暴露出了越来越多的问题。现行的沥青路面设计规范规定在沥青路面结构层设计
铬污染水体的治理是当前亟待解决的问题之一,零价铁(zero-valent iron,ZVI或Fe0)由于价廉易得且毒性较低、使用方便而被广泛用于除Cr(VI)。然而,普通零价铁去除Cr(VI)的反应活性较
结合界面是复合轧辊的重要组成部分,高速钢复合轧辊的性能与结合界面的性质密切相关。本文首先根据复合铸造轧辊凝固过程的温度场模拟结果,拟合出结合界面处的温度随凝固时间