基于数据挖掘与机器学习的恶意代码检测技术研究

被引量 : 0次 | 上传用户:rooku
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于数据挖掘与机器学习的恶意代码检测技术具有自动化、智能化、对未知恶意代码检测率高的优点,是当前恶意代码检测领域研究的热点,针对当前基于数据挖掘与机器学习的恶意代码检测技术特征描述方法单一、分类器泛化能力弱的问题,提出了一种基于多维特征与选择性集成学习的恶意代码检测技术,其主要的研究内容与创新点如下:首先,总结了恶意代码的定义和分类以及各种分析与检测技术的优势与不足。重点研究了基于数据挖掘与机器学习的检测技术并对检测的框架及原理进行了详细的分析与描述。其次,利用多维静态特征对恶意代码的信息特征进行描述。从恶意代码的文件结构层提取19维的静态结构特征,再从字节层、指令层、语义层分别提取不同n-gram长度的对应序列特征,相互结合组成初始特征集。为控制序列特征的规模,采用了三种行之有效的处理方法:①限制字节序列特征的搜索范围;②只关注常用指令与关键AP工调用所构成的序列;③结合信息增益与粗糙集理论对序列特征进行降维与约简。然后,对经过降维处理后的初始特征集,利用不同的分类算法对其中的不同长度的序列进行评估,保留对分类贡献大的特征,从而获得最优的特征子集。最后,利用已获得的特征子集,按照特征类型分别训练15个不同类型的基分类器,再依据精度值、AUC值和基于错分样本得到的差异度值选择出每个特征对应的最优基分类器子集,并采用相对多数投票的方式组合成集成分类器,然后对各特征对应的集成分类结果采用加权多数投票的方式进行决策融合并给出最终的类别判定信息。实验结果表明了本文提出的检测方法的有效性,并在实验数据集上获得了较好的检测精度与泛化能力,具有一定的实用价值。图26幅,表19个,参考文献69篇。
其他文献
在小学数学教学中,由于每个学生的认知水平、接受能力、思维方式等都不相同,所以他们在学习过程中出现各种各样的错误是正常现象。这种错误往往是学生对知识最真实的理解,是
我国海蜇水产品资源丰富,捕捞期比较集中,但由于海蜇自身结构特点,捕捞后如果不及时加工,极易自溶。在传统的加工处理方法里面,使用较多的就是通过添加足量的食盐以及明矾等
棉秆是一种来源广、产量高、能高效再生的生物质能源。但是目前棉秆的利用价值还很低,主要由于其处理工艺以及成本方面受到限制。棉秆皮是附着在棉秆上的一层韧皮纤维,占棉秆
目的评价支气管舒张试验的临床应用效果。方法将我院实施支气管舒张试验的113例患者作为本次研究对象,时间均选择于2015年1月到2017年1月。其中慢性阻塞性肺疾病(COPD)、支气
艺术人类学与影视人类学均为人类学体系中的分支学科。前者侧重于对艺术活动的社会与文化研究,后者则是以影像民族志(民族志影片)的摄制与研究为其传统学术疆域。基于人类学
白斑狗鱼作为新疆主要的经济冷水鱼之一,具有营养丰富、肉质鲜美及独特风味等特点,倍受消费者的青睐。近年来,随着养殖规模的逐渐扩大,合适的冷藏条件对于维持白斑狗鱼较好品
社会的高速发展,让人们坐在办公椅上工作生活的时间越来越久,长时间的伏案工作很容易给人们带来腰背肌肉损伤、腰椎间盘突出等病患困扰,而一把以用户体验为导向进行优化设计
近年来,我国食品行业快速发展,食品包装行业不断进步,自动灌装机的需求量大幅度增长,高效便捷的灌装设备受到厂家的青睐。其中,随着油辣椒销量连年增长,“老干妈”公司原有的
分析招标采购制度体系改革的必要性,包括国家发展战略需求、经济发展对招标采购的需求、实施改革整合基本条件、实施超越发展等方面。然后提出招投标法和政府采购法改革整合
<正>在日常审计实务中,由于存货的性质或位置等原因,注册会计师无法实施对存货的监盘,如水产养殖的部分产品(如鳗鱼、文蛤),有辐射的各种化学品以及在生产过程中因特殊配方或