基于特征选择和集成学习的入侵检测方法研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:mirrorwxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测是网络安全研究的热点领域,它是防范主机和网络攻击的一种有效措施。它的使用弥补了传统防火墙技术、签名认证技术和访问控制技术在安全防护上的不足。传统的入侵检测技术是通过人为构造的规则库来对数据进行甄别,其工作量繁杂而且检测率也不高。机器学习的出现为入侵检测提供了一种新的解决方案,入侵检测问题可通过机器学习中的分类问题来解决,通过使用入侵检测训练集来构建专门的分类模型,然后利用这个分类模型对新来的数据进行判断分类。但在入侵检测模型的构建中也存在着一些问题,入侵检测的训练集中不同类别的数据样本分布不平衡,以此建好的模型难以对少数类样本进行准确的分类。另外,入侵检测中数据的特征维度比较高,存在着冗余,影响模型分类的准确率和效率。所以针对这些问题,本文的主要研究内容如下:(1)对入侵检测基准数据集KDDcup99进行了去除冗余数据的处理,大幅减小了数据的规模,缩短了不同类别间样本的数量差距。然后在此基础上,对样本中每个特征的取值做了详细的统计分析,找出那些取固定值比例超过99.9%的特征,并对它们剩余的0.01%的取值在不同类别间的分布进行具体分析,找出影响度较小的那些特征,在模型构建前剔除掉了原始训练集中的5个特征,为下面特征选择中特征相关度之间的计算减轻了负担,同时还对文中使用到的基础分类器的超参数进行了网格搜索,寻到了效果相对较佳的那些参数组合。(2)设计了一种基于互信息和萤火虫算法的特征选择算法,该算法首先在尽可能减少特征间信息冗余的情况下,计算出每个特征和类别标签之间的互信息,并按互信息的大小对特征进行重要程度的排序。然后使用萤火虫算法在原始的特征空间中搜索最佳的特征子集,并按照特征的重要程度对每次迭代中的最佳特征进行增加和减少,最后,通过交集和筛选的策略对互信息和萤火虫算法得到的两个子集进行合并得到最终的特征子集。实验结果表明了本文提出的特征选择方法对模型的分类效果带来了提升。(3)设计了一种基于集成学习的入侵检测算法,该算法采用两种不同的集成学习方法来解决入侵检测中数据的不平衡问题。一种是基于限制性随机采样和特征选择的Bagging集成方法,使用决策树作为基础分类器,为保证基础模型的多样性和不同类别间数据的平衡,提出了限制性的随机采样策略来抽取训练子集。同时,对每个基础分类器所使用到的特征子集也采取了基于最佳特征子集情况下的半随机策略。另一种是基于改进的聚类欠采样的Stacking集成方法,这里主要是对原有的基于聚类的欠采样技术进行改进,在尽量保证每个类别原始数据分布的情况下减少多数类中的数据量。实验结果表明了上面提出的两个集成学习方法让少数类的分类准确度得到了提升。
其他文献
中红外与远红外波段作为最后一个开发的太阳物理观测窗口,包含着诸多新的研究价值。然而,红外天文的研究在其背景噪声和探测目标方面存在很大的特殊性,尤其是对太阳的红外波
褶皱-冲断带形成演化过程中各主控因素已得到广泛的研究,但侧向摩擦力这一因素却很少得到重视。有研究表明侧向摩擦力方向对褶皱-冲断带构造变形有着明显的影响。然而由于缺
目的:通过给SD大鼠灌服α-萘异硫氰酸酯(α-Naphthylisothiocyanat e,ANIT)建立亚急性胆汁淤积症模型,并探讨鼠李糖乳杆菌GG(ATC C 53103)对其肝功能保护胆汁淤积症幼鼠和抗
B族维生素(VB)是多种水溶性型维生素的通称,作为辅酶因子参与多种重要的生化反应,是生物不可或缺的生长因子。然而,近年来基因组学和生化分析证据表明,许多微生物尽管含有某类维生素依赖性的酶,却由于基因的缺失并不能从头合成该类维生素。这些缺陷型微生物的生理代谢或生态功能必需依靠外源的维生素或相近的前体分子。因此,不同微生物之间可能凭借维生素的种间传递而建立相互作用关系,对微生物群落结构形成与功能发挥可
锂离子电池作为高效率可充电电池,是便携式电子设备的主要移动电源。如今,随着锂离子电池在电动汽车和智能电网中的广泛应用,具有高能量和功率密度的现代锂离子电池要求高安
近年来,在我国短途旅游兴起与消费结构升级的共同作用下,乡村民宿开发建设规模逐年扩大。其在吸引资金和人才回流乡村、改善乡村基础设施、盘活乡村经济、传承乡村文化的同时
一流学科建设作为“双一流”建设的重要组成部分,是当前高等教育事业发展的突破口,也是国家和地方经济社会发展的动力源之一。当前,以一流学科建设为抓手已经成为地方政府提升高等教育竞争力和区域整体实力的核心战略举措。内蒙古位于祖国北部边疆民族地区,经济社会发展的基础与水平不高,基于发展的特殊性与迫切性,内蒙古的一流学科建设形成了政府主导,高校积极参与的建设模式,通过政府统筹规划,集全区之力,整合高校优势资
在发展中国家,中小型企业(SME)在培育社会经济发展中发挥着至关重要的作用。它们创造就业机会,增强社区权能,并为该国的GDP做出积极贡献;这项研究旨在调查影响纳米比亚温得和克中小型企业绩效的决定性因素。本研究使用了包括定量和定性研究方法的混合方法设计。本文设计了问卷调查表,并采访了四十二家中小型企业。通过问卷调查收集的数据,并与两家中小型企业支助机构(纳米比亚工商会和工业化、贸易与中小企业发展部)
瓜类细菌性果斑病(bacterial fruit blotch,BFB)是一种给葫芦科作物造成全球范围种植产业严重经济损失的重要种传病害,其病原菌为西瓜噬酸菌(Acidovorax citrulli)。该病害由
GATA转录因子是一类广泛存在于真核生物中的转录因子,在植物光响应调控、细胞分裂素响应以及碳、氮代谢等与次生生长相关的生物学过程中发挥重要作用。目前,对GATA家族的基因