HTTPS流量的获取与识别技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sqm_crscd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HTTPS是网络中应用最多的Web安全协议之一,主要用于保护用户的数据与隐私安全,解决了HTTP报文传输过程中的安全问题。然而不法分子基于该协议安全性高的特点,利用HTTPS页面散布不良信息,这给社会带来了隐患和危害。当前,传统的流量识别方法,无法很好的完成对HTTPS流量的识别分类工作。因此,针对于访问站点页面产生的HTTPS流量的流量识别工作显得重要而有意义。本课题的HTTPS流量识别思路是,针对给定页面,建立页面指纹,另一方面,从访问该页面的HTTPS流量中提取HTTPS流量特征与指纹进行匹配,从而达到流量识别的目的。本文首先给出一种页面指纹的组成,并介绍为采集页面指纹而开发的页面指纹提取系统。紧接着,给出了用以标识访问给定HTTPS页面产生流量的HTTPS流量特征的概念,并介绍为获得HTTPS流量特征而开发的HTTPS流量特征还原系统。在引入了页面指纹和HTTPS流量特征,并且给出了二者的采集获取手段之后,本文给出了基于LCS算法思想的指纹与HTTPS流量特征的匹配策略。最后,本文给出了基于单个指纹以及指纹集的流量识别方案,并对算法实验效果进行了分析。基于实验效果,本文提出了算法的优化策略。
其他文献
自然语言处理最根本的目的就是让计算机能正确处理人类语言,利用计算机对词语语义进行理解是自然语言处理中最为关键的问题。词义相似度计算作为语义理解的基础性工作已被广
近几年深度学习方法在自然语言处理领域越来越受到关注,深度学习通过特征组合使其能够表示句子的深层语义特征。本文基于深度学习的神经网络模型,研究情感分类的领域自适应、
在计算机图形学中非规则物体的模拟仿真一直占有着重要的作用,也是计算机图形学中的重要研究方向。从计算机图形学产生到发展至今国内外的研究人员通过不断的研究和实践检测
每年由心脏病导致的死亡率不断增加。因此,对于心脏生理和病理机制的研究刻不容缓。目前,利用计算机建模来模拟和仿真心脏电生理相关指标的方法,已成为交叉学科的研究热点,它
发展到现在,嵌入式软硬件的复杂程度大幅提高,软件开发受到前所未有的挑战。嵌入式软件开发涉及到大量工具,比如编译工具、调试工具等。因此一个简单易用,工具丰富的嵌入式开
随着现代通信技术的高速发展与Internet的普及,万维网成为了目前最巨大、分布最广泛的信息服务中心,自从2001年以来,目前超过30亿网页在线,每天以上百万的新网页的速度不断增
互联网技术的蓬勃发展使得信息安全领域面临重大的挑战。个人信息泄漏,恶意木马篡改,密钥的丢失等成为严重的网络安全隐患。人们在探索研究一种更为可靠的安全机制的道路上付
软件定义无线电(software-defined radio)是一种实现无线通信的新概念,最初被广泛应用于军事领域。由于无线通讯领域的多种通讯体系共存,导致各种通信标准间竞争激烈,频率资
随着社会的发展,数据量不断增大。但是如此大的数据并不都是有用的。因此从海量的数据中获取有用的信息是非常关键的。从而导致了海量数据的分析处理受到越来越多的关注。Map
随着国内数据库技术的不断进步和数据库系统的广泛应用,数据库管理系统的ODBC标准符合度,渐渐成为衡量数据库管理系统质量和性能的重要标准。对数据库产品进行ODBC标准符合性