基于数据流挖掘技术的流量识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:shengyan1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网新型应用的不断涌现,使得互联网的拥塞状况日益加剧。为了监测网络是否安全、高效、稳定地运行,确保各单位机构局域网中有足够的带宽,使得对网络流量进行准确的识别变得极为重要。本文的具体工作主要包括以下几个方面:(1)本文分析了当前流量识别的主要方法的特点。对网络流量识别的知识背景如现有的分类模型、网络数据捕获、特征抽取做了简单的介绍,对基于机器学习的流量识别算法如朴素贝叶斯分类、C4.5决策树、K均值、DBSCAN算法的不足和缺陷做了分析。(2)本文设计了一种基于CVFDT决策树的流量识别方法。CVFDT决策树是一种数据流分类算法,相比原有的C4.5和朴素贝叶斯分类方法,CVFDT决策树结点是增量创建的,且随着更多训练数据流入变得更加准确。此外原有的分类模型一旦建立,就不能动态更新,而该算法能处理概念漂移,适应于不断变化中的网络环境,能动态更新模型,具有较好的可扩展性,适应于在线识别。(3)本文设计了一种基于STRKM算法的流量识别方法。STRKM算法是基于K均值算法改进的数据流聚类算法,改算法解决了原有聚类模型不能更新,不能检测新应用的问题。实验表明该方法在参数合适的情况下具有较低的错误率,能不断更新簇中心,适用于在线网络流量识别问题。本文将数据流挖掘算法应用到流量识别领域中,解决了以往的算法不能识别动态变化的网络流量的问题。一方面扩大了数据流挖掘算法的应用领域,另一方面对于在线网络流量的识别研究有一定的参考意义。
其他文献
工程陶瓷材料的显微结构对其性能有重要的影响。由于多数材料是不透明的,其几何特征通常不能从块体样品中直接获得,传统方法通过在显微镜下获取样品的二维截面图像,来对其显
随着计算机技术的发展以及人类对移动通信需求的不断增加,下一代无线网络将是一个由各种无线接入技术组成的异构网络。在异构网络中用户将享受更多的服务并可随时随地接入网
受限于目前移动设备计算能力、存储能力和网络支持能力,移动设备尚不能支持普通个人电脑上的规模度的应用程序。应用程序如果要在移动平台上运行,应用提供商必须为移动设备重
随着Internet和Web技术的飞速发展,Web已经成为一个海量动态的信息资源库;而文本是信息最重要的载体,研究表明信息有80%包含在文本中。因此人们迫切需要能够从Web文本数据中快
近年来,随着Internet技术的迅速发展,J2EE和Ajax两种框架构建模式逐渐走向成熟,国内外对此有较深入的研究。在Web开发中,它们充分发挥了各自的优势,取得良好了效果。与此同时
Web数据挖掘是在Web资源环境中根据用户的浏览行为提取出用户关心的、有价值的信息过程。Web使用挖掘是数据挖掘的重要组成部分,用户是Web使用挖掘的核心。Web使用挖掘通过关
随着互联网的发展,相关网络信息越来越多,相应的电子邮件使用已经很频繁,并且已经深入到所有使用网络的人群中,成为一种方便快捷、经济的通讯手段。但是由于利益的驱动,垃圾邮件也
在当今信息化时代,如何准确鉴定一个人的身份、保护信息安全,已成为一个必须解决的关键社会问题。人脸识别技术是最有发展潜力的生物特征识别技术之一,由于其具有简单直观、
近年来,医学工程有了飞速的发展,大量医学数据通过测量仪器被详细的记录下来,因此导致医学相关数据海量增长。在如此海量的数据库中利用各种数据挖掘方法和技术来发现和总结
ZigBee是一种新兴的短距离、低速率、低成本和低功耗的无线网络技术,非常适合于工业控制、汽车自动化、农业自动控制和医用设备等领域。本课题以基于ZigBee技术的传感器网络