基于WEKA平台的贝叶斯分类器的扩展

来源 :复旦大学 | 被引量 : 0次 | 上传用户:moke707
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类算法是机器学习、模式识别、数据挖掘等领域中研究和应用最广泛的一个重要课题。目前已知的分类算法中一种重要的基于统计方法的模型是贝叶斯分类模型,在贝叶斯分类模型中实用性最高和应用最广泛的是朴素贝叶斯分类器。但是由于朴素贝叶斯基于的条件独立性假设在现实的并不一定成立,因此为了提高其性能,研究人员们提出了多种可以表示属性间依赖关系的朴素贝叶斯分类器的改进算法(如TAN,AODE,HNB等)。但是这些改进算法大多不能直接处理连续属性值类型,因此连续类型的属性值必须先离散化后才能被处理,这样可能会造成不必要的精度损失,尤其当训练数据中包含较多的连续变量属性的情况下。 在本文中我们提出了通过有效地定义条件概率分布来改善基于朴素贝叶斯分类器的改进算法的性能的方法,并在Weka的框架下实现了我们提出的改进算法,同时考虑到AODE算法较高的空间复杂度,我们利用选择性集成的思想对AODE算法进行了改进,以降低其存储空间复杂度。试验结果亦证明我们提出的改进算法与原始算法相比在性能上有一定程度的提高,并且具有更好的实用性。
其他文献
随着Internet的广泛运用,将应用扩展到局域网、广域网甚至Internet上已成为用户的普遍需求。分布式计算环境中计算机间高可靠、高精确的协同工作,时间同步是关键和基本的问题
根据图像对已知物体的识别和计数是图像处理和识别领域的一个研究方向。而对生产出的烟支进行数量的统计是中小型烟厂的卷结和包装车间之间一个必不可少的环节,采用图像处理
随着通信技术的高速发展,以及第三代移动通信系统(3G)技术的成熟和商用,移动网络的规模正在不断扩大,网络结构也正进行着不断地变化和调整,网络复杂度和异构性日益提高,通信网络的
随着计算机网络的高速发展,对网络设备的数据处理能力要求也越来越高。流分类技术将数据包按照指定的规则分类,从而提高网络设备的处理和转发速度,是防火墙和UTM网关等网络设
让计算机自动模仿某种艺术类型或某个画家的风格绘制肖像画,是非真实感绘制的一个难题,也是一个有趣的问题。本文开发了一个基于特征的肖像画自动绘制系统,只需要单张画家的
在深入分析标准移动IP较常采用的平滑切换和快速切换方案及其存在的问题的基础上,提出了一种新的适用于在广域网范围内移动的移动IP无缝切换的优化方案,并利用OPNET仿真软件
随着计算机技术尤其是网络技术的发展,业务流程管理系统所面对的用户不再是某个企业或企业联盟,而是数目众多、层次不一的普通用户。这些普通用户常常提出个性化的要求,需要个性
在当今高速网络发展中,许多应用对网络提出了不同于简单数据应用的服务质量的要求,需要提供完善的QoS保证,如果希望给这些应用提供较好的服务质量,要求网络中的交换式路由器必须
学位
近年来,随着互联网的发展,人们可以获取的信息以指数的速度增长。一方面,为了便于管理如此庞大的信息,文本分类技术日益引起人们的关注。另一方面,对于特定的用户而言,所需要的信息