基于日志特征的异常检测系统的设计与实现

被引量 : 0次 | 上传用户:stupid199001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算等技术的飞速发展与普及,应用系统正逐步迁移到以大型服务器集群为核心的分布式运行环境中,系统规模变得越来越大,复杂度越来越高。当系统出现故障时,系统维护人员面对大量的系统运行信息,系统异常行为检测将面临巨大挑战。应用系统的日志记录了系统的执行轨迹,并且存在于系统的所有组件中,因此可以通过挖掘大量包含丰富信息的日志来检测系统出现的异常行为。传统的日志分析和异常检测技术各有侧重,有些技术已日趋成熟,但解决相应问题的同时也隐藏着各自的缺点,往往针对某些特定场景或局部问题而难以面面俱到,因此需要一些新的观点,立足于现有成果,从不同角度和更深层次对该领域问题进行研究。基于上述背景,本文通过使用源代码分析、流程建模、数据挖掘、机器学习算法和异常值检测方法设计与实现了基于日志特征的异常行为检测系统。本系统基于较成熟的云环境,立足于日志分析,针对现有的技术难点进行改进,能够适应多样化的系统日志结构和格式,从时间序和逻辑序多个方面对系统行为加以分析,改善了日志分析中简单启发式方法造成的准确性不高和普遍的频繁模式挖掘常见的效率底下问等问题。本系统的的主要实现过程如下:首先通过Elipse的IDE插件进行目标开源框架的源码分析,针对源码建立索引并使用抽象语法树提取日志相关的模板信息和流程结构,包括每个日志的输出格式和上下文逻辑关系。然后利用分布式存储环境和计算框架对日志进行预处理,通过改进的模式匹配方法运用日志模板和流程模型对日志进行抽取转化,完成特征统计,选取流程状态变量和消息计数变量作为特征变量,以此为依据针对不同变量使用不同方式对日志进行特征分组处理,提取每组特征向量继而组成代表整体系统行为的特征矩阵。接着基于事物的主要矛盾,为了压缩矩阵规模和降低矩阵维度,将多元数据的特征在低维空间里直观地表示出来,论文使用主成分分析法来进行异常值检测,进而找到异常向量定位系统异常行为。最后使用决策树来表示系统的正常和异常行为,决策树的使用规范了系统行为的具体执行路径,为判断行为的合法性提供直接参考,同时采用各种报表对系统行为进行统计得到系统运行概况。在试验部分使用Hadoop开源系统验证了该方法的正确性和有效性,并进行了相关的功能测试和性能测试。
其他文献
背景和目的:采用标准化婴幼儿喂养困难评分量表,对6个月至3岁的婴幼儿进行喂养情况进行评定,了解婴幼儿喂养困难的发生情况,并探讨婴幼儿喂养问题的发生原因,为婴幼儿喂养困
随着全球能源危机、火力等传统发电带来的环境污染问题的日益突出,在众多新能源技术中,光伏发电是优选的新能源技术。但是,目前传统常规发电的成本每度电平均在0.4元,光伏发
随着信息技术的发展,互联网环境下企业生产物流系统发生了很大变化,以往的生产物流模式已无法满足现代企业的需求。本文从管理和技术两方面进行分析,发现传统企业生产物流存
为贯彻执行<中华人民共和国职业病防治法>,加强流动职业人群职业病防治工作,我们对某乡镇企业进行了调查,现将结果报告如下.一、方法与结果1.方法该企业主要生产各型暖气片.4
为掌握百合茎尖培养脱毒技术,为百合脱毒苗的大批量生产提供技术支撑,以百合品种卡瓦娜(Corvara)为材料,对不同来源的培养材料(未经处理的组培苗、经过4℃低温处理40d后的组
学困生不但基础差,学习兴趣不浓,而且还将影响整个学校的发展,因此,解决学困生的问题至关重要。本文分析了数学学困生的学习行为和心理特征;对有关的教学策略进行了研究。
本文试图通过对青少年的心理现状进行分析,挖掘其存在的问题,以社会工作的角度,探讨个案、小组、社区三种社会工作方法对青少年心理问题的干预,希望对青少年目前亟待解决的心
研究了吉林省通化产东北细辛挥发油的化学成分。采用水蒸汽蒸馏法提取细辛挥发油;用气相色谱-质谱进行分离测定,结合计算机检索技术对分离化合物进行鉴定,应用TIC峰面积归一法测
目的了解武汉市居民对本市社区卫生服务的知晓、利用及满意情况。方法采用随机抽样方法,从武汉市所有社区卫生服务中心(114个机构)已建居民家庭健康档案中随意抽取所辖居民的
近年来随着国家快速发展,隧道地铁等设施也逐渐增加。铁路、公路、地铁运行时间长、客流量大,如果隧道地铁的安全问题得不到足够的重视,人们的生命财产安全将受到巨大的威胁