论文部分内容阅读
恶意篡改文件的类型信息以掩盖文件真实类型达到诱骗用户访问、回避检测、隐藏数据等目的是计算机犯罪行为中最常用的手段。为了打击计算机犯罪,对恶意篡改的文件类型信息进行有效识别,已成为目前计算机取证研究的热点和难点。本文针对受损的文件类型信息识别技术进行了深入的研究,提出了三种文件类型识别的算法,具体包括以下三个方面;(1)提出了一种基于单球体模型的文件类型识别算法。提取文件的统计特征值;利用单球体模型描述文件统计特征值的分布区域;根据每种文件类型的统计特征值不同所描述区域的不同,检测受损的文件类型是否落入原文件类型的区域内。实验和分析表明,算法的时间复杂度较低,识别效果较好。(2)提出了一种基于k-球体模型的文件类型识别算法。利用k个小球体复合描述文件统计特征值的分布区域,更加逼近文件统计特征值分布的实际区域;检测受损的文件类型信息是否落入其中一个小球体中。此算法能够较为有效地识别同种文件类型中文件统计特征值有差异的文件类型,实验和分析表明本算法识别效率较高。(3)提出了一种基于NMF(非负矩阵分解)识别文件类型的算法。首先通过文件的统计特征值计算每种文件类型的指纹;然后提取受损的文件类型信息(被测文件)的统计特征值;将文件类型的指纹与受损的文件统计特征值组成一个矩阵,利用NMF算法对矩阵进行降维分解,得到一个低维空间中的数据;最后将被测文件的数据与各种文件类型指纹数据相比较,确定被测文件的文件类型。最后,对本文工作进行了总结,对受损的文件类型信息识别技术的发展进行了展望,并提出了将来的研究方向和构想。