基于批量二次规划网络的异常检测算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:mike595959
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测技术涉及机器学习、数据挖掘、统计学、信息论等相关学科,广泛应用于入侵检测、欺诈检测、医疗卫生异常检测、网络舆情异常检测、工业故障检测等技术领域。而在异常检测中,数据噪声或数据错误的存在,决定了基于数据驱动的方式进行异常检测所面临的困难:首先,数据噪声的存在会导致异常检测模型优化过程中学习噪声的特征,进而会影响模型的检测精度;其次,从含噪声样本中识别出真正的异常样本(异常暴露),同样是异常检测中的一个难点。对含噪样本进行抑制或约束,模型会选取决策边界附近的含噪样本,舍弃部分远离决策边界的含噪样本,这会导致含噪样本和异常样本之间的界限混淆,增大异常暴露的难度。因此,平衡噪声抑制和异常暴露对模型的影响有利于提升检测性能。本文首先提出了基于最大熵约束的批量二次规划(Batch Quadratic Programming,BQP)网络异常检测算法,其中BQP网络由特征抽取网络和QP输出层构成,其中特征抽取网络将批次训练样本映射至特征空间,输出批次特征向量;QP输出层构建批次训练样本的二次优化约束,即对训练样本引入支持向量数据描述(Support Vector Data Description,SVDD)的对偶问题作为约束条件,网络输出该问题的最优对偶变量解,实现噪声抑制的特征空间SVDD超球建模。通过最优对偶变量从批量特征向量中抽取不确定样本集(含噪声样本和异常样本),利用最大熵约束损失函数,增强异常暴露在网络优化过程中作用,平衡噪声抑制和异常暴露之间的影响。对于一些特定的训练数据集,如异常样本捕获相对容易,且构成一定规模的数据集,在模型训练时引入负类样本学习机制能够增强模型的表达能力。本文将BQP网络推广到半监督学习方法,提出了一种基于半监督学习的批量二次规划(Semi-Supervised Batch Quadratic Programming,SSBQP)网络。训练前,通过三元组采样方法制作含有部分标签信息的半监督训练数据;训练时,根据批次训练样本的标签信息,提出了自适应SVDD二次约束,修改了SVDD问题的约束条件,使SSBQP网络处理不同批次样本时能够更合理的匹配批次样本的标签信息。实验中,本文设计了三个控制对比实验,并设置对照组基线方法,验证了BQP网络和SSBQP网络的异常检测性能。
其他文献
海洋舰船目标检测对海上交通监管、海上搜救、重点港口区域海洋防御以及掌握敌方海上资源分配等军民领域均具有重要意义,基于高分辨率光学遥感卫星图像的舰船目标持续监视与
目的:本研究在Wistar大鼠卒中后抑郁(PSD)模型的基础上,结合病理检测、行为学检测和免疫组化蛋白定量、RT-PCR-mRNA检测,以及用丁苯酞注射液干预后的成纤维细胞生长因子2(FGF
畜禽养殖过程中产生的环境孕激素和糖皮质激素的污染问题严重威胁了人类健康和生态环境,而且目前国内外对此缺乏相应的研究,因此,研究畜禽粪便中类固醇激素物质的环境行为与
改革开放40年以来,广东作为中国第一经济大省,为中国的经济发展做出了突出贡献。然而,广东省内区域发展差距过大、区域间发展不平衡的矛盾突出,制约着广东经济与社会的健康持
近年来,固体废物造成的环境污染日益严重,社会也越来越重视固废的管理问题。《固体废物管理》一书详细叙述了非洲、亚洲、欧洲、拉丁美洲、加勒比群岛、北美洲各个地区和国家的固体废物管理情况。此文本的翻译,一方面旨在让国内读者了解更多固废管理的知识;另一方面,也可以为该领域的其他译者提供一些借鉴。本报告翻译材料选自《固体废物管理》(Solid Waste Management),该文本属于科技文本,语言结构
【目的】前期研究发现DH基因在急性髓系白血病(AML)患者中异常高表达,为观测AML初治和缓解期患者与正常人DH蛋白表达水平差异,并比较DH蛋白表达与其ATP酶活性的关系。【方法
背景和目的:卒中是影响人类健康的严重疾病,具有发病率高、致残率高、死亡率高的特点。卒中给社会和家庭带来了沉重的负担。研究表明社会经济状况(SES)与卒中的发生发展密切
目的:探讨肩胛恶性肿瘤手术方法对术后功能的影响。方法:回顾性分析2015年7月至2018年8月于我院行肩胛骨恶性肿瘤切除的患者共17例,男6例,女11例,年龄17~74岁,平均年龄为53.6
激光诱导击穿光谱学技术(Laser-Induced Breakdown Spectroscopy,LIBS)是一项新的化学分析技术,由于其多种优点目前被广泛应用于材料识别以及混合物定量和定性分析中。其中,L
体操是我国竞技体育的传统优势项目,在世界大赛中一直处于领先地位。从20世纪80年代开始,先后诞生了李宁、李月久、李敬、黄力平、李小鹏、杨威等世界大赛的冠军和奥运冠军。