基于马田系统的两类别分类问题研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:iversonKKE3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘中的一项重要工作内容。在常用的分类方法中,马田系统因基于数据进行分析而不需要对数据的分布进行假设,并且能够有效进行特征变量的筛选,真正意义上达到降维的目的,而在许多领域得到应用。本文主要对马田系统中两类别分类问题进行研究。主要的工作有以下的两点:(1)基于粒子群算法的马田系统两类别分类方法研究传统的马田系统在进行特征变量的筛选时,是使用正交表和信噪比方法来实现的,但一些学者研究的表明:在进行特征变量选择时,使用正交表和信噪比并不一定是最佳的方式。本文研究基于粒子群算法的马田系统分类方法(基于平衡数据),构建优化模型,将粒子群算法与马田系统方法进行结合,用粒子群优化算法对特征变量进行选择,使其更好的用于平衡数据的分类问题中。(2)基于集成思想的马田系统不平衡数据分类研究在现实生活中,不平衡数据分类问题普遍存在,不平衡问题是指分类类别样本量有显著的差异,而同时少数样本类往往是人们所关注的。传统马田系统在对不平衡问题进行分类时,分类的正确率会受多数类样本的影响,而使得结果倾向于多数样本类,导致忽视了少数样本类正确率的重要性。本文针对传统的马田系统方法未考虑数据不平衡因素的影响,提出将优化思想、集成的思想与马田系统相结合,以提高不平衡数据分类效果为目标,构建优化模型,用以对马田系统进行改进,使其更好的用于不平衡数据分类问题。
其他文献
从“一辆自行车、一块砧板、一杆秤”做起,到办屠宰场,开餐馆,再到坐拥世界一流旅游集团,苏志刚心里一直有个原则,“要么不做,要做就做最大最好的。”世上有两种人,一是扮虎吃猪,一是扮猪吃虎,苏志刚显然属于后者。  在广东,有些方言很传神,比如“口水多过茶”和“扮猪吃老虎”。长隆集团创始人苏志刚显然属于后者。  即便带领长隆成功跻身世界主题公园集团前十强,苏志刚依然自称是一个“只有小学文化的农民”。面对
【摘要】目前,随着教学事业不断的在发展之外,我们的教学方法也应该得到长足的进步。在小学时代,学生们的自主学习意识不强,对枯燥的学习方法没有概念,所以采取游戏的教学方法将事半功倍,让学生们在快乐的游戏中学到真正的英语知识,这就是游戏教学的方法的好处。小学生的英语如何学习到位,如何既不枯燥又能在欢乐的游戏中接受英语的学习,这都是很大的挑战,所以,本文论述了英语教学中,小学生游戏学习方法的几点好处以及正
制造业作为典型的传统产业之一,是我国国民经济的支柱产业。在全球经济背景下,制造产业整体的技术能力、创新水平与产品质量都有了显著提高,然而由于一些中国制造的产品在国际市
近几年来,以互联网为代表的计算机信息技术迅速普及,传统商业数据已逐渐向网络积累。网络商品交易的数据能通过数据挖掘的方式合理利用并为企业决策和战略发展服务。数据挖掘在