基于倾向性文本过滤的IM监控系统的研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:chinaprogram
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
即时通信(Instant Messaging,简称IM)是一种实时的互联网交流形式,伴随着网络的开放性和日益增长的规模,它已经成为人们自由交流信息的便捷手段,极大地改变了人们的联系方式。然而在IM得到广泛应用的同时,却存在着很大的负面效应,如不良信息的广泛传播,机密信息泄露,影响正常工作效率等。这时,一个能对IM软件进行有效监控的系统有了很大的市场需求,但目前国内IM过滤软件多采用基于主题的过滤,使得在过滤精度上有所欠缺。本文针对现有IM监控软件的缺陷,以建立一个高效、准确的监控系统为目标,实现了一个原型系统。本文的研究工作主要包括以下几个方面:1、研究了IM监控系统实现平台——Netfilter框架的设计思想和工作原理,着重分析了其扩展机制及应用;然后针对IM监控系统的过滤需求,选择合适的Netfilter框架钩入点,扩展了框架对应用层IM协议的支持。2、提出了IM监控系统的实现方案,深入分析并讨论了系统实现中的一系列关键技术,包括IM软件协议解析方案、中文分词技术、倾向性文本过滤技术、TCP连接阻断技术以及可加载内核模块(LKM)技术和内核空间与用户空间的通信技术。本文针对系统过滤准确性和实时性的需求,在分析IM文本消息特点和实际应用特点的基础上,对基于语义分析的倾向性文档过滤技术进行了重点研究,给出了一个适用于实时过滤IM消息的倾向性文本过滤方法。3、设计并实现了一个基于倾向性文本过滤的IM监控系统原型——TFIMM(Instant Messaging Monitoring System based on Tendency Text Filtering)。该系统应用了本文所给出的倾向性文本过滤方法和旁路监控技术,不仅有效提高了IM文本信息过滤的准确性,而且避免了对网络速度的负面影响。4、搭建了系统的实验环境,通过召回率、正确率等指标对本文给出的倾向性文本过滤方法进行了测评,并从吞吐率、延迟率两方面对系统性能进行了分析和评价。实验结果表明,该原型系统达到了预期的效果。
其他文献
随着人们生活水平的提高,脂肪肝的发病率不断上升。临床上,医生使用B超仪诊断脂肪肝,仅凭肉眼进行定性和经验性的判断,诊断结果受主观因素影响较大,具有一定的局限性。利用计
随着信息化的快速发展,网络安全隐患也日益突出,权威机构调查表明,局域网内部的安全威胁高于外部,因此,局域网的安全理论研究与应用成为网络安全产品发展的新热点。由于局域
随着计算机网络技术的发展,数据库安全问题受到越来越多的关注,如果我们对数据库中的数据进行加密处理,那么数据库的安全性就能有所提高,即使某一用户非法入侵到系统中或者盗得数
图像修补的广泛应用使得图像修补技术成为近几年图像处理中的一个研究热点。图像修补技术研究是以一种自动修补的方式实现对破损图像的修补,在图像的信息化产生和发展的过程中
随着嵌入式技术的发展,硬件设备的价格下降,嵌入式系统存贮能力迅速提高,应用中出现越来越复杂的数据资源需要管理,因此嵌入式文件系统的重要性显得更加突出,它也成为RTOS系统发展
随着互联网软件技术及其应用迅速发展,基于Web Services的分布式计算模式日益成为软件技术和应用发展的趋势,Web Services为分布式计算提供了一种新的范例。WebServices技术是
随着并发软件系统在国民经济、国防等关键领域的广泛应用,如何验证其正确性和可靠性以保证软件质量成为日益紧迫的问题。对并发系统而言,其内在的不确定性使问题的难度更大。通
学位
自从二十世纪七十年代以来,无线网络越来越受到通信业界的重视。无线网络以网络拓扑结构为标准,可以分为两类:一类是集中式控制的,即有中心的,典型的如无线局域网、GSM网等;
本文首先分析了当前各种主流身份认证机制,分别对它们的安全性和应用范围进行了分析,然后对一次性口令认证机制的四种模式进行了深入研究,分析了它们的安全性和实用性,最后针对秘