基于机器学习的网页恶意代码检测技术研究

被引量 : 0次 | 上传用户:zzzaaaqqq1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着个人PC机的普及和互联网的快速发展,网页成为人们发布信息和获取信息的重要途径。然而很多网页中含有恶意代码,恶意代码在用户打开网页时会自动运行且不易被察觉,从而造成用户主机受到破坏或者用户重要数据泄露。近年来,网页恶意代码制造者为了逃避静态检测技术,使用混淆技术来逃避传统的特征码检测,造成了代码检测的漏检和误检。现有的如高交互客户端蜜罐等动态检测方法由于检测效率太低,并且无法主动对大量的网站进行检测。针对这些问题,本文提出了一种基于机器学习的混合型网页恶意代码检测方法。该方法首先用网页爬虫抓取网页代码文件,提取网页脚本代码特征;其次,用分类算法对所搜集到的特征集进行训练,构造出基于网页代码的分类器;随后使用构造好的分类器对抽取的网页代码特征进行分类;最后把分类为恶意代码的网页送入高交互客户端蜜罐中检测,从而可以有效地检测出网页是否为恶意网页。该方法有效地结合了机器学习分类检测技术和动态网页恶意代码检测技术,实现了对网页恶意代码的多种检测。本文对随机抽取的含有恶意代码的网页进行测试,实验结果表明,使用本文提出的基于机器学习的混合型网页恶意代码检测方法能够较为准确地检测出网页恶意代码,能够区分现有混淆技术处理后的网页代码,在保证效率的同时准确率达到93%。
其他文献
传统的无线局域网(Wireless Local Area Network, WLAN)技术经过多年的发展,已经非常成熟,且具有设备价格便宜、性能稳定等优点。于此同时,WLAN技术在应用过程中也暴露出一些
针灸疗法是中医学体系的一个重要组成部分,对一些疾病(例如慢性疼痛)具有良好的治疗效果。针灸效应作用机制至今尚未解决。研究针灸效应的细胞响应有助于理解针灸效应机理,推
公安机关作为国家的行政执法管理机关,担负着打击敌人、保护人民、惩治犯罪、维护稳定的重大使命。但是,由于公安机关的业务活动复杂,其服务又具有无形性和效用潜在性,导致现
<正>在当今的地球上,最强大的物种无疑是我们人类。而从生物分类学上讲,我们人类属于哺乳动物。也就是说,而今的世界是哺乳动物的世界。然而在6500万年以前,地球上最强大的统
中国现代小说历经百年发展,已经形成了丰富的写作传统,五四时期至20世纪30年代前,以鲁迅为代表的短篇小说和小说雅俗形态的并置、问题小说与写实主义写作的盛行、现代主义的
随着国民经济的增长,基础建设的规模也在逐渐扩大,地下交通系统迅猛发展。本文以石家庄六线隧道施工为工程背景,针对粉质粘土地层工程地质和列车荷载作用条件下深大基坑桩锚
茶叶是一种既反应了中国文化形象同时又具有典型文化意义流传己久的传统产品,茶文化也是历史悠久、内涵丰富,并融入中国传统文化深刻的精髓,两者相辅相成,这一点在茶容器上也
近几年来,我国房地产虽然一直在政策调控的利剑下艰难地谋求发展,但从国家统计局的统计数据来看,它依然是我国国民经济的支柱型产业,是带动我国国民经济发展的中流砥柱。政策
目的对重复经颅磁刺激与无抽搐电休克治疗首发抑郁症的临床疗效和安全性进行分析探究。方法 84例首发抑郁症患者,随机分为对照组和实验组,各42例。对照组患者采用无抽搐电休
波兰钢琴家莱谢蒂茨基(Theodor Leschetizky,1830-1915)是“钢琴教育大师”车尔尼的高足,是一位有着“历史上最出色钢琴教师”之称的钢琴教育家。他不仅培养了一大批声名卓著的钢