基于信息增益和相关性的贝叶斯分类算法研究

来源 :网络与信息 | 被引量 : 0次 | 上传用户:watermb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
朴素贝叶斯分类以统计学理论为基础,所以具有一定的精确度,但它没有考虑属性间是否相互独立以及空缺值。信息增益(IG,Information Gain)是有效的特征选择方法,它提供了在分类系统中,某个属性能否在分类时带来有用信息。属性间的相关性分析可以说明在分析时是否要把它们都考虑进去,通过这样的分析可以去除不必要的信息。把信息增益和属性相关性相结合,可以改进朴素贝叶斯分类的局限性,从而在精度上对其进行改进。
其他文献
在钙质砂地层中进行浅层平板载荷试验,确定地基承载力和变形模量,讨论其影响因素,供同行参考借鉴。
由于高边坡通常包含多级且形状特殊给边坡的土石方的计算带来很大的难度,常用的方格网法,断面法用来计算边坡土石方量的过程相当繁琐且计算精度不高,文章通过分析高边坡的形状特性,结合地形图测绘建模方法,对边坡建立不规则三角网,并详细介绍了地形测绘中使用的南方CASS软件采用三角网法准确计算高边坡土石方量的过程及计算过程中需要注意的问题。
在临港船坞坞室土方开挖过程中,由于坞墙发生较大位移,出现了坞墙廊道顶板上的32T吊车轨道轴线偏离原设计轴线的问题。文中简要阐述了坞墙廊道上的32T吊车轨道轴线偏移的原因,详
文中介绍了5万t半潜式自航工程船的DP系统,并通过对动力定位系统的故障模式与影响分析的实船试验及检验的过程,阐述了二级定位系统如何满足设计需求和规范要求。
无线局域网的安全性是人们关注的热点也是一个亟待解决的问题。本文首先介绍了无线局域两安全性的基本安全机制;接着从楣关威胁和安全协议入手,重点分析了无线局域网的安全缺陷
摘要:目前,高校在学籍管理、成绩管理、师资管理等方面积累了大量的數据资源,如何发挥数据挖掘技术的优势,将数据挖掘技术应用于高校的教学管理中,成为了当前国内外关注的学术热点和前沿性课题。本文主要是对数据挖掘技术在高师生教学技能考核评价中的应用进行研究。  关键词:教学技能考核;数据挖掘;决策树    1 引言    目前,高师院校中积累了大量的教学技能考核数据。数据挖掘技术可根据现有的考核数据进行准
文中介绍了通过简单的实验和经验公式来确定小半径曲线桥的预应力钢筋与管道的摩擦系数,以较准确计算预应力钢筋摩擦损失,验证结构安全;同时介绍了采用橡胶板式支座、挡块、
由于海洋可再生能源的海上支撑结构所处海洋环境恶劣,因此造成施工困难、建造成本高,不利于商业化发展。所以依托现役及在建海上工程建筑物的基础结构进行海洋可再生能源的研
随着银行业信息化建设的快速发展,信息系统不仅为各项业务的运营提供后台支持保障,而且随着新产品、新业务和新流程的不断推出,信息系统日益成为业务发展的直接驱动力和核心竞争力,因此信息系统在业务应用中的风险范围和程度也急剧加大,大量数据存储于计算机中,与手工相比,它会受到更多的威胁。因此,有效控制信息系统在业务应用中的风险成为摆在我们面前的一大课题。    1 信息技术的广泛应用给银行带来的风险    
许多单位原来计算机的数量很少,后来逐步添加了一些计算机,组成具有一定规模的局域网,而原来组网时并没有给连接计算机的网线做标识,或只加了1234、ABCD这样的纸制标签,容易出现雷同,时间久了有些标识还会模糊不清,这给以后的网络维护工作带来了不便。在给局域网进行标准化改造过程中,给交换机与计算机相连接的网线配对是一项繁琐的工作,下面介绍四种常见的配对方法:  1.使用网线测线器:这也是人们常用的方法