基于机器学习的P2P网络流分类研究

被引量 : 0次 | 上传用户:qutong19921107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,P2P网络凭借其对等、自由、开放的特性在互联网的诸多领域呈现出蓬勃发展的态势,已经成为Internet网络流的主宰流量。P2P网络技术的发展给一方面给网络安全带来更大的威胁,另一方面,庞大的P2P流量吞噬而着网络带宽,使得非P2P网络的带宽得不到满足,给网络运营以及网络管理者带来全新的挑战。通过P2P流识别技术来加强管理和控制P2P流量是解决该难题的研究方向之一。然而随着互联网技术的发展,P2P应用为了适应网络环境,越来越多的使用动态端口、隧道技术以及协议加密等技术,这使得传统的利用端口和应用层特征等识别技术无法满足P2P流识别的要求。随着机器学习理论的不断成熟,其在医疗诊断、图像识别、音频识别以及网络安全领域的应用越来越广泛。机器学习利用数学统计知识和算法理论建立有效的学习模型,从数据层面挖掘内在规则,对信息量要求不大、不会涉及用户隐私,而且能够应对动态变化的数据环境,所以机器学习方法非常适合识别具有动态性的P2P网络流。本课题主要研究基于机器学习的P2P流分类方法,基于机器学习的P2P流识别利用P2P流统计特征建立分类模型,一方面如何从大量的P2P流统计特征中选出高效的特征集对于分类模型的分类效果有着深刻的影响;另一方面,如何建立分类模型也是最终分类效果的关键,本文主要内容如下:1.由统计原理建立的P2P流数据拥有上百个特征,面对如此众多的特征,在ReliefF的基础上提出了一种改进算法ReliefF&特征选择,能够删除ReliefF中的冗余特征,不但降低了特征维数,而且能提高特征集的分类能力。2.对集成学习算法的研究中,比较分析了AdaBoost和Bagging集成学习的优劣,在Bagging的学习的基础上引入了选择性集成理念,基于分类器之间的差异性度量Q统计量设计了通过不断删除差异性最小的分类器来选择部分分类器集成的PBagging算法。基于决策树算法作基分类器,进行实验验证,发现PBagging能够提升Bagging的分类正确率,在不同分类器规模下,PBagging都能表现出比Bagging更高的分类准确性。3.研究不同类型的分类器集成,提出了一种由贝叶斯分类器、SVM、决策树这3种分类器构成的集成模型,通过相关网络流数据进行实验发现该集成算法的分类正确率显著高于每个参与集成的单个分类器。本文的研究成果能有效提高特征选择的可利用价值,结合改进的集成学习算法能够进一步提高P2P流的识别率,对于P2P流的分类提供了全新的解决方案,将促进P2P流的管理和控制,也有助于建立更加可靠安全的互联网环境,进而营造和谐的网络氛围。
其他文献
本文通过对东坡词用典进行分阶段的定量统计和分析,探究东坡词各个阶段用典的个性和共性:东坡词用典在各个阶段都有自己较为独立的特色,用典技巧也随着时间的推进不断走向成熟
2013年暑假期间在电视荧屏中杀出两匹黑马——《中国汉字听写大会》与《汉字英雄》,这两档以“汉字听写”为形式的益智文化类电视节目以高收视、高关注度获得社会舆论的空前好
核心能力是企业最重要的资源,企业核心能力的数量和质量决定了其经营领域,尤其是多元化经营的广度和深度.文章详细分析企业成长中的多元化和归核化,给出了有效结合核心能力培
在全球经济一体化、文化大交融的背景下,举办大型体育赛事(Mega-sport Event)已经逐渐成为各个城市提高城市美誉度、促进城市产业升级的战略工具。中华龙舟大赛以龙舟竞渡这
随着我国教育体制的日趋完善,如何让家庭经济困难学生能够接受高等教育的问题显得越发重要,因为这是社会主义优越性的一种体现形式,也是国家经济发展的重要保证。我国政府制订了
扁鹊这样的神医碰到齐桓侯,也只能惹不起躲得起。疾病的治疗,医患之间高度信任和配合十分重要。
<正>2017年以来,受益于国内经济形势企稳、电商和物流行业高速发展等因素影响,我国叉车行业再次出现超预期增长,各类产品以及国内外市场均取得优异表现。同时,在工业4.0的时
针对我国目前由于地域广及流动人口多所导致的失踪人员难以寻找的问题,利用Android智能手机摄像、GPS、Open CV、Java CV、Java、Java EE、My Sql等技术开发基于Android图像
青海大部分地区的花儿会都是伴随着庙会而展开的。有庙会就有宗教祭祀,宗教祭祀的场合就是花儿会的会场,会场也就是花儿会传说缘起的中心点。瞿昙寺是当地藏汉民众的信仰中心