基于大数据分析的恶意域名检测技术研究与实现

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:XINGQIPING
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络安全是我们永远无法回避的话题,不法分子在互联网上常常会使用域名作为传播网络攻击的手段,比如连接木马、僵尸网络通信等。速变域名和域名生成算法等技术的应用使得网络攻击更加隐蔽、恶意域名更难被识别,域名黑名单在这种情况下作用有限,而通过分析域名的DNS数据来识别检测恶意域名成为一种更有效的方法。本文首先调研了恶意域名检测的相关技术,分析了当前恶意域名检测面临的困难,总结了目前已有的技术方案以及相关研究成果,同时研究了机器学习分类模型和大数据技术,利用HadooP、Spark、Kafka等搭建了大数据分析的基础架构。在此基础上,本文从大量DNS数据入手,利用机器学习方法构建了基于DNS行为特征的恶意域名检测模型。通过分析DNS数据的统计分布,从4个维度提取了 22个特征,通过交叉验证比较随机森林和梯度提升决策树两种分类模型,测试证明随机森林在准确率、召回率等指标上具有优势。最后,基于大数据平台设计和实现了恶意域名检测系统,并将构建的检测模型应用到系统中。系统架构的设计考虑了输入来源、数据存储、执行效率、可扩展性等一系列问题,最终划分成4个功能模块。为了保证系统能够在高速网络中保持稳定可用,采取了许多性能优化方案,主要包括:使用网络流量的分流模型来提升高速网络流量的抓取能力;通过优化Kafka配置来应对网络流量的短时激增,提高系统的吞吐能力和稳定性;通过白名单过滤将在DNS数据中占据较大比例的流行合法域名的数据过滤掉,从而减少后续模块的数据处理压力;数据处理模块通过定时将域名聚合信息写入MongoDB,来减少对HDFS数据的反复读取和处理,等等。本文构建的模型和实现的系统均在实际网络中实际部署应用,进行恶意域名的在线检测。经测试,系统达到了良好的检测准确率和效率。
其他文献
近年来,男子蝶泳运动员的年龄有逐渐减小的趋势,据教练反映"运动员练不上去,没有什么发展潜力"。主要问题出在基础训练不扎实,专项训练不足,主项能力的积累不厚,特别是水陆力
天然气水合物是天然气和水在特定条件下形成的一种新型能源矿产,是未来的战略性能源。本文根据国内外研究成果,总结归纳了天然气水合物的地震法、地球化学法、地球物理测井和
摘要:现如今,新一轮基础教育课程改革的开展正如火如荼,学生综合素质的培养和全面发展备受关注和重视,传统灌输式的课堂教学策略显然已经不合时宜,无法满足新课改的要求和学生发展的需要,亟须进行根本性的改革与创新。基于上述背景,本文将结合教学实践经验,以现代教育教学理论为依据,从创新教学方法、设置课堂提问、组织合作交流与融入现实生活四个维度出发,全面地分析新课改下小学数学课堂教学方法和策略的革新。  关键
本文基于构建主义视角,以宏观经济学课程为例,探讨问题导向型知识构建的方案设计。提出四个研究目标,依次递进,更新的理念、充足的教辅资源、合理的问题设计、科学的考评方法
摘要:小学三年级学生已经有了一定的字词积累,能够自己进行简单的阅读,是提高学生自主提问能力的重要时期。通过培养学生的自主提问意识,可以让学生养成自主思考探究的习惯。因此通过课前预习、读书笔记、读书分享等方式让学生养成自主提问、自主解决问题的良好习惯,提高学生阅读的能力。  关键词:自主提问;阅读习惯;有效途径  良好的自主提问阅读习惯可以使人受益一生,在阅读中学生问题意识的培养,可以让学生带着问题