论文部分内容阅读
针对目前恶意代码检测方法不能满足实际需求的问题,文中提出基于IRP(I/ORequest Packets)的运行时恶意代码检测方法,并将人工免疫系统应用到基于IRP的恶意代码检测中,提出多个具有创新性的人工免疫算法,提高了恶意代码检测的效率和准确率。本文取得的主要研究成果包括:(1)提出一种基于人工免疫的分类模型,该模型模拟了生物免疫系统由先天免疫到适应性免疫的识别过程,并成功将其应用到基于IRP的恶意代码检测中。(2)针对单一采用否定选择算法学习、检测效率低的问题,提出将否定选择算法和肯定选择算法相结合,精选出仅在恶意代码中出现的IRP序列实现恶意代码检测。此方法由于仅采用少量的检测器进行检测,极大地提高了检测效率,并有效降低了误检率,同时检测率也没有明显下降。针对目前否地选择算法不能终身学习的问题,提出终身学习的否定选择算法。该算法模拟人类适应性免疫系统的中枢耐受和外围耐受过程,实现终身学习。算法的终身学习能力解决了原有否定选择算法误检率高的问题。(3)提出将数据挖掘方法应用到基于IRP的恶意代码检测中。采用朴素贝叶斯、贝叶斯网络、支持向量机、C4.5决策树、Boosting等多种数据挖掘方法实现基于IRP的恶意代码检测。针对当前嵌入型恶意代码隐蔽性高、难以检测的问题,提出了基于C4.5决策树的嵌入型恶意代码检测方法。通过提取训练样本中信息增益最大的500个n-gram作为属性特征,建立决策树,实现对未知嵌入型恶意代码的检测。实验结果表明,该方法可有效检测嵌入型恶意代码。(4)基于肯定选择算法的思想,提出一种可实现多类别分类的算法——肯定选择分类算法。该算法将多类别分类问题转化为基于自体/非自体的两类分类问题,通过生成自体类别检测器实现分类过程。提出了基于最大距离的初始检测器生成算法,以较少数量的检测器覆盖较大的自体空间,并通过克隆选择搜索最优检测器。针对分类过程中可能出现的孔洞、检测器重叠等问题给出了相应的解决方法。针对实际应用中可能出现的噪声数据给出了处理方法。对基准数据集的实验分析及比较结果表明,与AIRS, ANSC等基于人工免疫原理的分类算法及其他一些常见分类算法相比,该算法在分类准确率上具有一定优势。(5)遵循机体免疫系统先天免疫和适应性免疫相结合的工作方式,提出一种低维数据分类方法——先天免疫和适应性免疫相结合的人工免疫系统IAAIS。该方法定义一个形态空间,将各类别抗体均匀散落在形态空间内,为抗原设定一个“危险区域”,落在“危险区域”内的同类别抗体可以接受抗原刺激。学习阶段,通过训练样本的刺激得到受刺激的抗体集合;分类阶段,通过未知数据“危险区域”内抗体刺激度值的大小来判断其类别。文中还给出了针对各类别训练样本数量不均衡问题的处理方法。实验结果表明,相对于基于人工免疫系统的算法ARIS、ANSC及C4.5决策树、朴素贝叶斯、贝叶斯网络、支持向量机等经典分类算法,IAAIS在对低维数据的分类准确率上具有一定优势,对Iris的分类准确率达到了97.3%。