基于网络爬虫的Web组件自动化检测系统的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lnclnc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,大量的开源组件广泛用于Web站点的搭建,但是这些开源组件本身也可能存在容易被攻击者利用的各种漏洞和缺陷,因此准确识别出目标站点的Web组件信息能够提升安全测试的效率,对保障站点的安全性有着重要意义。目前对于Web组件的识别主要基于固定规则分析网页源码和响应报文信息,但这些信息容易被隐藏或修改,从而导致识别准确率低,同时对Web指纹库的完备性要求较高。针对上述问题,本文提出一种Web组件探测方法,并在此基础上设计与实现了一套自动化Web组件指纹探测系统。主要工作包括:(1)针对Web服务器类型的识别,提出了一种基于机器学习算法的识别模型,以响应报文首部字段相对位置顺序和相关字段内容为特征,构建基于随机森林算法的多元分类器,对Web服务器类型识别准确率达到97.73%;针对CMS系统类型的识别,提出了一种基于爬虫获取目标站点多页面的静态文件路径信息的方法,通过提取关键路径信息能识别CMS系统,并与现有检测工具进行比较实验,识别准确率高于现有检测工具。针对主机端口指纹的识别,提出了一种将Nmap集成到系统进行自动化端口扫描的解决方案。(2)基于上述Web组件检测方法,从安全测试的实际需求出发,设计了自动化Web组件检测系统。该系统包含爬虫扫描模块、任务调度模块、系统存储模块、用户交互模块和Web组件指纹检测模块五个部分,并对每个子模块的实现提供了落地方案。同时使用Quartz和Redis消息队列对系统进行解耦,设计了整个系统的工作流程。(3)基于上述设计,实现了自动化Web组件探测系统。系统使用Redis集群、Nginx、主从MySQL等多种技术保证了系统的高可用和易扩展性,并以Web界面的形式提供给用户,最后抽取目标站点样本,同时创建了 12个任务对系统的主要功能进行测试,能够实现对目标站点Web组件的自动化识别。
其他文献
新时代,统一战线的性质、地位、任务决定了其是巩固脱贫攻坚成果和服务乡村振兴的重要组织力量;与其他统战组织相比,高校统一战线在巩固脱贫攻坚成果和服务乡村振兴工作中不仅具有政治协商等一般优势,还在人才、科技、文化、校友资源等方面具有独特优势;探索高校统一战线优势作用发挥的路径,可为巩固脱贫攻坚成果和乡村振兴凝聚强大合力,注入新动力.
随着虚拟现实、车联网、云桌面、云游戏等低延迟需求应用兴起,5G系统需要能够提供低延迟的用户体验和巨大的数据量,因此低时延成为5G网络的关键性能需求之一。随着移动边缘计算的引入,使得这些部署在网络边缘的MEC设备为移动终端提供了计算和存储功能,从而实现了低延迟的需求。在应用程序/用户设备开始连接到服务之前,对于用户来说发现一台合适的边缘应用程序服务器的IP地址非常重要。因此,如何发现边缘应用服务器地
建设世界科技强国,实施创新驱动战略,基于成果转化视角的校企大型仪器共享平台建设是必要的.基于高校大型仪器设备利用率低而企业对大型仪器设备需求迫切的供需矛盾,提出面向企业,面向市场加强校企大型仪器共享平台建设.充分发挥大型仪器的科研价值,同时基于大型仪器共享平台促进校企科技研发合作,可缩短科研转化周期,简化流程,加快成果转化,推进技术研发和创新.
基于船舶自动识别系统(AIS)、雷达、声呐等海洋传感器数据的目标高效识别技术对保障海洋安全和维护海上贸易发展有着重要意义。其中,多维度目标数据关联与累积识别是研究热点之一,此类研究的算法性能很大程度上取决于传感器所采集数据的数量与质量。然而,受限于数据集公开程度有限、真实数据采集困难、后期处理复杂等条件,如何获得充足的海域目标数据用于算法的训练和测试是该领域亟待解决的难题。目前已经存在一些针对海域