企业电子文档相似度快速检测技术的研究与实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zhaiziaiaiai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
企业电子文档属于企业的重要资源,是企业核心竞争力的具体表现形式。其主要包括企业的合同,项目文档以及待发专利等。在激烈的知识竞争中,由于核心电子文档的泄露,导致企业的经济损失以及名誉损失,甚至关系企业的生死存亡,因此企业对电子文档安全防护和管理的重视程度也越来越高。本文就企业如何防止核心电子文档泄露进行了研究,并指出其中比较容易被忽略的一环——企业电子文档形成过程之中产生的过程文档。这些不同版本文档广泛存在于参与该文档编写、整合、审核、修改、提交等操作过程的员工电脑上,涉及到的员工数量众多,极易产生泄密隐患,也是现有企业文档管理系统所忽略的问题。针对上述过程文档的检测问题,本文研究实现了一个企业电子文档相似度快速检测系统。该系统以COPS系统模型为蓝本,采用文本块分级匹配的思想,选取不同粒度文本块的数字指纹进行文档相似度检测。利用企业提供的核心文档的预处理建立涉密文档样本库,而后通对相似度检测,将涉密过程文档从员工电脑内海量存储的电子文档中检测出来,提交给企业文档管理系统进行妥善处理,以达到缩小企业涉密电子文档分布范围的目的,进而提高企业核心文档的安全性。实验结果和企业反馈信息表明该系统具有较高的检测速度和准确率。
其他文献
网络技术的高速发展,使网络应用渗透到了国民生产及国家安全的关键领域,但是在网络通信的同时,出现了大量的网络攻击,对信息系统造成了巨大破坏,使网络安全技术成为了各国政府和研
随着互联网以及通讯技术的飞速发展,以互联网为基础的新型舆情传播媒体逐渐代替传统媒体,成为人们获取与传播舆情信息的主体。由于互联网的实时性、高效性,舆情信息往往呈爆
网站防篡改系统是在互联网迅猛发展的大潮中出现,并伴随着网站安全性需求的深入不断发展起来的,但是由于采用技术和架构方面的滞后,目前此类系统都存在一定的限制或缺陷。在
随着Internet的发展和Internet中信息的迅速增长,个性化服务日益受到广大用户的青睐。作为个性化服务的核心技术,用户建模也逐渐受到研究者的重视。用户兴趣建模技术作为个性化
随着多媒体技术的飞速发展和Internet的普及,数字作品极易被修改和复制,其版权保护已成为当前的热点问题,目前已提出多种水印算法以保护其版权。一般来说,图像、音频、视频等
目前人们普遍使用搜索引擎技术来检索Internet上的信息。搜索引擎是基于WWW的信息处理系统,它在一定程度上为人们解决了在WWW上查找信息的问题。但是现有的信息都是分布在异
三维重建是计算机视觉领域最热门的研究方向之一,它是一门研究物体的冗余二维信息恢复物体在空间中的三维信息的技术。本课题的输入可以是单个数码相机多方位拍摄被重建物体