论文部分内容阅读
企业电子文档属于企业的重要资源,是企业核心竞争力的具体表现形式。其主要包括企业的合同,项目文档以及待发专利等。在激烈的知识竞争中,由于核心电子文档的泄露,导致企业的经济损失以及名誉损失,甚至关系企业的生死存亡,因此企业对电子文档安全防护和管理的重视程度也越来越高。本文就企业如何防止核心电子文档泄露进行了研究,并指出其中比较容易被忽略的一环——企业电子文档形成过程之中产生的过程文档。这些不同版本文档广泛存在于参与该文档编写、整合、审核、修改、提交等操作过程的员工电脑上,涉及到的员工数量众多,极易产生泄密隐患,也是现有企业文档管理系统所忽略的问题。针对上述过程文档的检测问题,本文研究实现了一个企业电子文档相似度快速检测系统。该系统以COPS系统模型为蓝本,采用文本块分级匹配的思想,选取不同粒度文本块的数字指纹进行文档相似度检测。利用企业提供的核心文档的预处理建立涉密文档样本库,而后通对相似度检测,将涉密过程文档从员工电脑内海量存储的电子文档中检测出来,提交给企业文档管理系统进行妥善处理,以达到缩小企业涉密电子文档分布范围的目的,进而提高企业核心文档的安全性。实验结果和企业反馈信息表明该系统具有较高的检测速度和准确率。