论文部分内容阅读
信息安全问题已关涉到一个国家政治、经济和文化安全的层面。而漏洞是引发信息安全问题的一个重要因素。同时,大量的漏洞信息造成了严重信息过载,如何从这些漏洞数据中发现有用知识,给信息安全防范提供决策建议,成为随之而来的重要问题。数据挖掘正是解决此类问题的一项关键技术。它是从大量的数据中,提取隐含在其中的潜在的有用信息和知识的过程。本体是共享概念模型的明确形式化的规范说明,是对一个特定领域或应用中语义的共同认识。利用本体技术作为专家的领域知识或背景知识,引导数据挖掘过程,可以发现更多不易察觉的知识以及避免无意义的结果。利用背景知识辅助数据挖掘的技术,在知识发现领域已经得到了广泛应用,对提高数据挖掘质量具有重要的研究意义。本文首先介绍信息安全漏洞库,以及数据挖掘的相关概念、原理和步骤;研究了针对信息安全漏洞库的关联分析和时序预测建模和挖掘过程,得到了漏洞与软件之间的关联规则,以及对漏洞爆发数量的有效预测。同时,论文探讨了领域本体的相关理论和构建方法,基于CWE (Common Weakness Enumeration)建立了信息安全漏洞本体;提出在数据挖掘的预处理阶段借助漏洞本体技术,通过将低概念层级的漏洞数据实例信息泛化至高概念层级,提高项集的支持度,挖掘出隐藏的高概念层级的关联规则;在关联规则评估阶段,基于漏洞本体技术分别设计ADARF和RDARF筛选器,实现了根据用户关注度和类相关性选出更有意义的规则。实验证明了上述方法的有效性。