决策树算法中模糊语义的研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:gj12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义决策树算法虽然可以进行语义方面更加精确的匹配,但存在硬性划分的缺陷。在连续属性语义化的过程中,将训练集中的数据映射为语义概念类中的某个概念时,它把数据严格地划分到语义概念类中的某个概念,没有考虑它们对某个概念的隶属度。然而,一个数据是否属于某个概念具有一定的不确定性或者说模糊性,即存在语义的模糊性问题。模糊逻辑虽然在一定程度上解决了不确定性问题,但其本质仍是用确定的隶属度来表示不确定的模糊性,即存在模糊的不彻底性。本文针对语义决策树算法中存在的问题,对决策树算法中的模糊语义进行研究,提出了一种连续属性随机模糊语义化方法CARFS。通过利用语义概念树和FCM算法求得隶属度,同时利用云模型求得隶属度的准确度,即随机性,解决了语义决策树挖掘中没有考虑到模糊性的问题,同时解决了模糊的不彻底性问题。在生成语义概念树时,本文提出了一种语义概念树自动生成方法。通过对基于遗传算法的连续属性离散化算法进行改进,形成语义概念树的叶子结点,进而采用类平均法进行概念层次的提升,充分利用了连续属性每个值的信息,使得到的概念层次更加合理。之后,将CARFS方法引入到Fuzzy ID3算法中,提出了基于模糊语义的决策树挖掘算法SFID3,并指出了寻找最优决策树的方法。通过数据集Iris、Adult和Wine对SFID3算法进行验证,实验结果表明了该算法的可行性和有效性,与语义决策树算法相比,利用该算法生成的决策树具有较高的分类准确率。
其他文献
数量型关联规则用于发现数量属性之间的关联关系,因其广泛的应用背景而成为了一种重要的关联规则类型。因为目前布尔型关联规则的研究相对较成熟,所以经典的方法是通过数量属性
机会主义路由的出现,打破了传统单路径路由对于转发节点的限制,并为Ad Hoc网络路由协议的设计提供了新思路。机会主义路由利用了无线信道的广播特性,允许机会性侦听到报文的节点
传统信息检索方法没有考虑用户的兴趣因素,当不同用户在输入相同查询时得到的检索结果是相同的,不能根据用户的真实检索意图给出个性化的结果。本文提出一种基于用户兴趣和术
粒计算由L.A.Zadeh在1997年第一次提出后,即受到世界广泛关注,粒度计算被认为是一种看待客观世界的世界观与方法论,从某方面考虑粒计算也是一种模仿人类从不同粒层看待问题,
自然现象的模拟仿真一直是计算机图形学的研究热点,其主要研究内容是利用计算机模拟真实世界物体,以及自然现象,比如:火焰、海浪、云层等。将这些元素添加至图形场景中,可显著
随着云计算技术的迅速应用和“互联网+”的全面展开,大数据产业在传统行业和日常生活中的重要性也愈加明显。就个人而言,我们所需要管理和分享的数据量,从之前的MB逐步发展为GB
随着世界移动通讯市场的迅速发展,手机已经成为人们日常生活工作中不可缺少的通信工具。由于人与人之间的交互呈现多样化、复杂化的态势,因而单个手机已无法满足人们的需求。
国民经济的快速发展,使我国矿产资源的消费达到空前的高度,特别是最近几年采矿业的迅猛发展,对我国矿产资源的开采技术提出了更高的要求。在矿产资源的开采过程中,因矿石中含
随着网络、多媒体技术的快速发展,网络教学正逐渐成为重要的研究和应用领域,与之相适应的网络教育资源建设、网络学习管理系统也日益受到人们的重视。但目前网络教育建设中存
近年来,Web开发技术发生着日异月新的变化,人们每天面对呈指数倍增长的海量资源,他们希望将自己沟通的领域扩展到人与网络资源方面。人们将自己有价值的信息记录下来,方便日