论文部分内容阅读
即时通信(Instant Messaging,简称IM)是一种实时的互联网交流形式,伴随着网络的开放性和日益增长的规模,它已经成为人们自由交流信息的便捷手段,极大地改变了人们的联系方式。然而在IM得到广泛应用的同时,却存在着很大的负面效应,如不良信息的广泛传播,机密信息泄露,影响正常工作效率等。这时,一个能对IM软件进行有效监控的系统有了很大的市场需求,但目前国内IM过滤软件多采用基于主题的过滤,使得在过滤精度上有所欠缺。本文针对现有IM监控软件的缺陷,以建立一个高效、准确的监控系统为目标,实现了一个原型系统。本文的研究工作主要包括以下几个方面:1、研究了IM监控系统实现平台——Netfilter框架的设计思想和工作原理,着重分析了其扩展机制及应用;然后针对IM监控系统的过滤需求,选择合适的Netfilter框架钩入点,扩展了框架对应用层IM协议的支持。2、提出了IM监控系统的实现方案,深入分析并讨论了系统实现中的一系列关键技术,包括IM软件协议解析方案、中文分词技术、倾向性文本过滤技术、TCP连接阻断技术以及可加载内核模块(LKM)技术和内核空间与用户空间的通信技术。本文针对系统过滤准确性和实时性的需求,在分析IM文本消息特点和实际应用特点的基础上,对基于语义分析的倾向性文档过滤技术进行了重点研究,给出了一个适用于实时过滤IM消息的倾向性文本过滤方法。3、设计并实现了一个基于倾向性文本过滤的IM监控系统原型——TFIMM(Instant Messaging Monitoring System based on Tendency Text Filtering)。该系统应用了本文所给出的倾向性文本过滤方法和旁路监控技术,不仅有效提高了IM文本信息过滤的准确性,而且避免了对网络速度的负面影响。4、搭建了系统的实验环境,通过召回率、正确率等指标对本文给出的倾向性文本过滤方法进行了测评,并从吞吐率、延迟率两方面对系统性能进行了分析和评价。实验结果表明,该原型系统达到了预期的效果。