论文部分内容阅读
随着下一代网络技术的发展,因特网和传统电信网的逐步融合已成为网络发展的必然趋势,VoIP技术迎合了这一趋势。作为VoIP中的重要控制信令,SIP (Session Initiation Protocol)已被3GPP(3rd Generation Partnership Project)确定为第三代移动通信全IP网络的核心协议,但随着VoIP的发展及广泛应用,VoIP网络中的安全尤其是垃圾电话问题已成为目前关注的重要议题。2008年,IETF(The Internet Engineering Task Force)组织制订了RFC 5039,对SIP网络中垃圾电话问题进行了详细的阐述。本文对SIP网络和垃圾电话防御技术进行了研究,并且深入分析了用户的呼叫行为特征。本文对支持向量机及相关算法进行了研究,探讨了支持向量机在反垃圾电话技术中的应用,在此基础上提出了一种SIP安全网关的实现方案。本文主要对以下三个方面进行了研究:1)预处理算法研究训练样本集的属性个数和样本规模是影响训练速度的重要因素。本文研究了基于区分矩阵的属性约简算法,该算法能够有效地处理离散属性值,但对于连续属性值的处理有限,本文对连续数据离散化方法做了相关的分析,将属性约简算法与支持向量机训练算法进行了结合,实验表明,支持向量机的训练速度得到了提高。本文还详细分析了K最近算法及在支持向量机的数据预处理中的应用,设计了一种加权的K最近邻预处理算法,实验表明,该算法能够删除一些噪声样本,提高训练速度和训练精度。2)训练算法研究本文对支持向量机的训练算法进行了研究,重点研究了SMO算法,分析了中止条件、步长缩放因子、缓存、并行计算等因素对SMO算法性能的影响。指出了Keerthi的SMO算法有效迭代次数较少原因,在此基础上,提出了在初次更新失败情况下,重新选择另一个样本与违反KKT条件的样本进行第二次更新的改进SMO算法,实验表明,该改进算法训练精度较高,但训练时间较长。3)支持向量机在垃圾电话防御技术中的应用研究本文研究了SIP网络和垃圾电话防御技术,对垃圾呼叫的呼叫行为特征进行了详细的分析,并且设计了一种应用层SIP安全网关,对直路过滤、图灵测试等模块的实现进行了阐述。在支持向量机的应用研究中,设计了一种存放用户呼叫信息的数据记录格式,该记录格式适用于awk程序对呼叫行为特征进行提取。在数据训练方面,通过对新增用户样本的分析,提出了通过利用KKT条件对SIP安全网关中的新增数据进行选取的策略。