论文部分内容阅读
随着计算机技术和网络技术的发展,系统发生人为异常的次数越来越多,危害程度越来越大,扩散的范围也越来越广.虽然长时间以来人们设计出多种方法来应对它,比如杀毒软件,防火墙,入侵检测等等,但都不能彻底有效的解决层出不穷的各种安全事件.所以,大量专业科研人员继续研究用新的方法来有效抑止异常事件的发生.其中仿生物免疫能力来构造系统就是其中的一个发展方向.当自然界的生物遭受到来自外界病菌侵害时,自身的免疫系统会分辨出异于正常组织的成分,然后调用白细胞来杀灭病菌.安全免疫系统就是模仿这种原理,利用系统自身的辨识力来分析出异常事件,然后采取有效手段来阻止异常对系统的侵害HMM(Hiden Makov Model)是一种基于统计的随机过程算法,成功的应用于语音信号处理,手写系统,和基因序列识别等多个领域.该文首先讨论分析了HMM的具体算法,描述了HMM的三个问题.然后搭建实验平台,构建了数据采集模块,采集来自系统日志的FTP系统调用.经过词汇分析,转换为观测序列.根据先期的的"完全正常"观测序列,构造了一个初始的HMM模型,这个模型假定是系统的运转是完全正常的.获得初始模型之后,根据HMM算法中的前向后向算法,计算其他观测序列在这个模型之上的生成概率.在构建过程中,改进了算法,用截断法和窗口法来提高系统的分辨率.系统中还利用Baum-Welch re-estimation Formulas构建了模型训练的模块,利用此模块训练模型,以使模型符合真实的系统状态.针对"慢攻击"方式,提出模型比较的方式,通过模型的差异,来找出某个用户行为的偏离度.最后,对HMM模型的根本性缺陷,提出一种改进的序列构造方法,来改进模型.通过以上步骤,成功搭建了一个基于HMM的免疫安全系统平台,为更深入研究和改进做了充足准备.