【摘 要】
:
随着网络规模的不断扩大和各类网络应用的不断发展,互联网己成为人类生活中必不可少的基础设施。与此同时,各类网络攻击活动也日益猖厥,给网络空间安全带来了巨大的隐患。网络钓鱼是指在互联网上进行的一种用户欺诈行为。攻击者通过钓鱼网页诱骗用户输入其账户、密码等信息以窃取用户的私密信息及财产,给网络用户带来了极大的损失,因此,如何准确、高效地检测钓鱼网页是网络安全的研究热点。迄今为止,国内外学者已经提出了很多
论文部分内容阅读
随着网络规模的不断扩大和各类网络应用的不断发展,互联网己成为人类生活中必不可少的基础设施。与此同时,各类网络攻击活动也日益猖厥,给网络空间安全带来了巨大的隐患。网络钓鱼是指在互联网上进行的一种用户欺诈行为。攻击者通过钓鱼网页诱骗用户输入其账户、密码等信息以窃取用户的私密信息及财产,给网络用户带来了极大的损失,因此,如何准确、高效地检测钓鱼网页是网络安全的研究热点。迄今为止,国内外学者已经提出了很多不同类型的检测方法。其中,基于深度学习技术通过自动提取URL的特征来检测钓鱼网页无需获取网页内容,无需人工提取特征,是一类高效、准确率高的检测方法。但是,现有的基于深度学习的钓鱼URL检测方法仍然存在以下问题:1)当前常用的URL分词方法使敏感词丢失有效信息,或无法获取新出现单词的词嵌入向量,或无法获取URL特殊字符与前后字符的联系信息;2)当前的检测方法中所用检测模型对URL数据特征提取不够全面,如未综合考虑URL数据的空间局部特征和序列特征,或未考虑到URL数据中长距离、非连续的单词之间的依赖特征;3)当前所使用的检测模型多是一种静态模型,无法有效学习到不断变化的数据特征,从而导致模型的准确率逐渐降低、稳定性不足;4)当前基于深度学习技术的检测方法未考虑检测模型本身的鲁棒性,而AI模型本身容易受到对抗样本的攻击,攻击者通过在URL样本实例上添加精心构造的扰动生成对抗样本使检测模型的检测准确率降低,甚至使其失效。本文依托国家自然科学基金项目,针对以上问题进行研究,本文研究内容和创新点如下:1)针对URL分词存在的信息丢失等问题,提出了一种基于敏感词分词的方法,该方法首先根据特殊字符对URL进行单词级别划分,并将特殊字符看作单词处理以获得特殊字符的有效信息,然后对其中的非敏感词进行字符级别划分,而将其中的敏感词作为一个整体与其余字符进行区分,这样能够明显标记URL中的重点信息,有利于神经网络分类器提取更具有代表性的特征。2)针对检测模型对URL数据特征提取不够全面的问题,首先提出了一种基于CNN-Bi LSTM的钓鱼URL检测方法,该方法综合利用了卷积网络和双向长短记忆网络的优势,通过CNN自动获取数据的空间局部特征,通过Bi LSTM自动获取数据的时序特征,有效提升了检测的准确率、精准率、召回率及F1值。然后针对现有检测模型无法获取URL中长距离、非连续的单词依赖特征,提出了一种基于MPAN的钓鱼URL检测方法,该方法将URL构造为一个双向无环图,通过MPAN获取单词间的交互信息,实验表明该方法能有效提升对钓鱼URL的检测能力。3)针对现有检测模型的稳定性及鲁棒性低的问题,提出了一种基于拟态架构的多分类器钓鱼URL检测方法,该方法以邬院士提出的拟态架构为基本框架,结合CNN-Bi LSTM、MPAN两种深度学习模型,对钓鱼URL进行检测。通过可动态调度、可重构的异构冗余分类器从原始数据中自动提取特征进行数据的检测,然后对多个分类器的检测结果进行汇总、裁决,来生成最终的检测结果以提高检测方法的鲁棒性。通过分类器的增量更新方法使分类器能够学习新数据的特征以提高检测方法的稳定性。
其他文献
无线Mesh网络(Wireless Mesh Network,WMN)是近年来逐渐成熟的一种新型无线网状网络,有着很好的自组织性能,在可扩展性,组网速度等方面表现优秀,被视为下一代无线网络的重要组成部分。随着网络信息技术的发展进步,无线Mesh网络相关应用场景开发不断拓展,其中,将其作为灾后应急网络基础架构的相关研究是目前世界范围内的研究热点。信道分配算法决定了无线Mesh网络的网络表现,以WMN
医学图像配准的主要目的是对相同设备拍摄的不同场景或者不同设备拍摄的相同场景下一系列图像进行适当的空间变换,使得两幅或多幅图像间的对应点在空间位置上对齐。把医学图像配准技术应用于医学影像分析,可以辅助进行疾病诊断和手术治疗。但是由于成像技术的不同,产生很多不同模态的医学图像。若能够有效结合多种模态图像的成像优势,提供更加准确和互补的信息,从而为医生在疾病诊断和手术治疗中提供更全面的依据。解决上述问题
光热转换智能水凝胶可以将光能转化为热能,再通过热能引发水凝胶材料的响应行为。这种具备光热转换功能的智能水凝胶材料在药物缓释、海水淡化、光驱动器件等领域具有良好的应用前景。但是目前的光热复合水凝胶存在光热转换性能差、响应速度慢、力学性能不佳、功能单一等缺点。针对这些问题,本文以开发新型具有优良光热性能的多功能水凝胶为目标,将聚N-异丙基丙烯酰胺(PNIPAM)温敏水凝胶分别与高光热转换效率的二维MX
近年来,随着科学研究和工程技术的发展,各领域对计算能力的需求越来越大,促使了多核计算系统的快速发展,国内外主流计算平台核心数不断攀升。根据科学计算领域的二八法则,程序中20%的代码往往占据80%的执行时间,这些时间占比较大的代码块通常是程序中的循环结构。因此,利用多核并行计算资源来提升程序中核心循环的性能是一个重要的研究方向。Open MP是基于编译指示的共享存储多线程并行编程模型,由于其简单、高
随着我国可持续发展战略的实施与不断深化,建筑垃圾资源化利用的研究也在持续升温。将破碎后的建筑垃圾作为骨料制备再生混凝土,是建筑垃圾资源化利用的重要途径之一。建筑垃圾在破碎过程中会产生大量粒径小于0.16 mm的微细粉末,约占建筑垃圾总质量的15%,即再生微粉,具有一定的潜在活性。相比于再生粗骨料和再生细骨料,再生微粉的回收及应用研究并不充分。与此同时,随着我国经济的快速发展,新型工程建设项目不断涌
历史文化名镇在我国的历史文化村镇体系中有着“乡之头,城之尾”的重要地位,体现着重要的历史价值、文化价值和人文价值。我国历史文化名镇保护工作成绩显著,极大地带动了古镇的经济和社会发展,但是部分地区也出现了一些大拆大建、拆旧建新、过度商业化等问题。我国相关法律法规中明确指出应当定期对规划的实施进行监督检查,但是由于我国规划实施评价工作开展较晚,在学术层面的研究处于起步阶段,尚未形成系统的理论体系。因此
2020年新基建的发展在中国大地上形成燎原之势,为国家稳经济、稳增长助力。中国社会也正伴随着新基建的发展步入智能时代,众多互联网及其相关产业发展迅猛的同时,大量的核心关键技术仍然存在“受制于人”的风险。公众对我国互联网的安全性存在一定疑虑,最具有代表性的质疑莫过于“美国能否按下中国互联网的暂停键?”之类的言论。作为互联网中最关键的基础设施,DNS(Domain Name System,域名系统)的
云计算凭借其强大的计算能力和存储能力得到了用户的认可,服务上云已成为行业应用发展的趋势。然而,云计算在给我们的生活带来了极大便利的同时也引入了新的问题,如云上的虚拟机容易受到攻击者影响、云资源分配不合理等。分析当前的云计算安全与资源分配研究现状,仍存在以下三个方面的不足:1)为了便于运维和管理,当前的云环境大多采用静态同质架构,然而静态同质的云计算环境容易成为攻击者的目标,增大了云平台被攻击的可能
语音是人们交流沟通的主要方式,随着计算机和智能电子设备的使用越来越广泛,人机交互成为了人们的必然需求,为了更加便利地使用智能电子产品,可以使用语音来实现人机交互。语音实现人机交互需要两个过程,一是智能电子设备“听懂”人类发出的语音信息,即语音识别;二是智能电子设备将文本转换为语音“说出来”,即语音合成。一般在人机交互的过程中,人们只需要听到智能电子设备发出的语音即可,但随着基于深度学习的语音合成技
近年来,随着移动支付、人工智能、边缘计算等技术的快速发展,传统零售模式发生了巨大变革。在阿里巴巴提出“新零售”的背景下,基于计算机视觉的智能售货柜受到了广泛关注。智能售货柜需要快速准确的识别目标商品,获得顾客拿取的商品信息并进行结算。但目前大多数商品识别系统部署在服务器,随着智能售货柜设备的增多使得服务器的压力增大,不能达到商品实时检测的效果,影响顾客购物体验。本文设计并实现了一种轻量化的商品识别