网络信息内容审计技术研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:philipsyin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪以来,互联网和移动通信的普及浪潮已席卷世界每个角落,对人们工作、学习、生活等都产生了非常深刻的影响。然而通信网络带来丰富信息的同时,也带来了新的问题,网络为泄露企业的商业机密、技术机密和传播不良信息提供了方便。论文针对企业内外网信息交互中可能出现的机密信息泄露和不良信息传播,设计了一个适用于大型企业信息网络的内容审计系统,并围绕该内容审计系统中的关键技术进行研究,研究工作主要从以下两方面展开:1)在内容审计速度方面。对网络信息内容审计系统进行设计时,采用分布式集群结构,通过负载均衡技术将数据流量进行分流。本文提出了一种基于会话的动态负载均衡算法,该算法能够将新到来的会话链接分配到集群中负载最小的服务器中,同时又考虑了网络信息内容审计系统需要对应用层中的内容进行审计,将同属于一个会话中的数据包分配给同一台服务器进行处理,既有效地提高了内容审计的处理速度,又兼顾了集群中服务器的负载情况,解决了在大型企业网中信息交互量较大时的系统处理速度的性能瓶颈问题,并且保证了审计内容的完整性。2)在内容审计准确率方面。本文的研究主要针对文本内容展开,着重对文本分类技术进行深入研究。对文本分类中所采用的技术进行较为全面的研究,并通过实验对比KNN算法、朴素Bayes算法和SVM算法在中文文本分类应用中的分类效果和分类时间,分析三种算法的优劣;并提出一种改进的TF-IDF权重计算方法,将训练集的每个类别的主题词与待分类文本的关键词之间的相关性考虑在内。经过实验分析,改进的权重计算方法虽然在中文文本分类的时间效率上有所降低,但其有较好的分类效果,其查准率和查全率均高于TF-IDF权重计算方法。
其他文献
当今网络的发展日新月异,网络已经成为人们生活中不可或缺的一部分。然而,黑客们依靠自身技术的优势,让那些网络安全意识不强的人们在不知不觉中承受经济上的损失。传统的杀毒软
各种恶意软件变种生成技术的出现使得恶意软件的数量以指数的形式增长,所以对恶意软件变种的识别与分类显得尤为重要。由于变种技术能在保持程序的原有功能不变的情况下改变
随着大众健康意识的日益提高,普通公民对糖尿病健康服务也提出了新的需求。人们希望能尽早预知糖尿病风险,足不出户地掌握自身病情状态。为满足这一需求,智能健康产业应运而
随着多媒体技术与网络技术的迅猛发展,网络普及率大幅提高,人们可以方便快捷地下载、存储和分发多媒体信息。这给人们的娱乐生活带来便利的同时,也给多媒体作品的版权保护带
基因表达信息是理解基因功能和基因调控的潜在机制的重要线索,是生物学医学研究中的重要内容之一。基因芯片是检测基因表达的有效技术,它可以在一次的实验中同时检测成千上万
余代数是一种基于状态刻画动态系统的数学结构,该结构以范畴上的自函子为参量可以统一描述常见的动态系统,从而为研究动态系统的性质提供了抽象平台。余代数逻辑是用于描述余代
移动对象数据库是对移动对象的时空属性进行管理和操作的系统。目前,集中于对移动对象位置的研究,移动范围相关的技术相当的有限。然而,随着有关移动区域的应用不断出现,以往的移
随着定位技术的发展,以参与方的坐标信息作为自身身份凭据的概念逐渐引入到安全机制中,基于位置的身份验证在安全定位和密钥协商中扮演着越来越重要的角色,更多的协议也将设备的
由于当前互联网架构是一个五层的沙漏模型,无法对中间层进行较大改动。另外,Internet服务提供商为了追求最大投资回报率,不愿部署新式的网络,因为只有大多数自治域都部署后新
专家评标是招投标中的关键环节,专家抽取与通知工作的电子化和自动化是电子招投标发展的必然趋势,也是保障专家评标规范、合理、高效开展的重要途径。对于具有远程抽取和并行