【摘 要】
:
分类是数据挖掘的一项主要任务。分类器设计是决定分类性能的关键因素之一。近年来,分类器集成学习由于其在降低分类系统泛化误差、简化分类器设计等方面的优良表现,成为人工
论文部分内容阅读
分类是数据挖掘的一项主要任务。分类器设计是决定分类性能的关键因素之一。近年来,分类器集成学习由于其在降低分类系统泛化误差、简化分类器设计等方面的优良表现,成为人工智能、机器学习、模式识别、神经计算等领域的研究人员以及各工程应用领域中的技术人员共同关心的一个研究热点。本文在全面介绍分类器集成的研究现状、工作机理和发展趋势的基础上,提出了用于提高分类器集成系统分类性能、扩大其应用范围的多种算法。包括:(1)在分析了集成的整体性能与成员分类器性能和多样性之间关系的基础上,提出了一种基于聚类的分类器选择集成算法。该算法以多样性作为聚类距离,以准确性作为选择标准,能够显著提高原系统的多样性及分类性能。(2)利用分布估计算法对特征集进行优化选择建立分类器集成。经过优化选择不仅降低了集成规模,而且提高了集成的整体性能。(3)研究了如何利用集成方法进行缺失数据的分类。提出了一种利用分类器集成进行缺失数据分类的算法。该算法对数据缺失机制不作任何假定,而且可以处理测试样本中新的缺失模式。(4)研究了如何利用集成进行自适应的分类系统增量学习。提出了一种基于两级假设检验的学习方法。既避免了对旧知识的“灾难性遗忘”,又增强了学习的“稳定性”。
其他文献
目的探讨O型臂导航辅助治疗强直性脊柱炎(AS)合并下颈椎骨折临床疗效。方法选择2009年1月至2014年12月强直性脊柱炎合并下颈椎骨折手术治疗的患者26例,按照手术方法不同分为A
目的分析在社区高危妇女乳腺癌筛查中应用彩色多普勒超声联合钼靶X线检查的价值。方法选取广东省东莞市东部片区的13 560例适龄妇女作为研究对象,针对其中的高危人群,均给予
新医改背景下,公立医院获得了新的发展空间,同时也面临着新的挑战。新医改明确指出要对医疗卫生资源进行合理规划,并要求公立医院要充分发挥公益性职能,坚持以病人为中心,在
现在汽车不断增多,使城市交通拥堵现象剧增,给我国交通运行提出了新的挑战。面对交通拥堵、交通安全问题,需要汽车驾驶员拥有良好的驾驶素质和驾驶技巧,能够在驾驶过程中保证
目的分析临床分离鲍曼不动杆菌的耐药性及其在各临床科室的分布情况,为医院感染控制提供依据。方法收集该院2012年1月至2014年7月临床分离鲍曼不动杆菌,采用VITEK 2Compact全
<正>皮质醇是由机体下丘脑-垂体-肾上腺皮质神经轴系(HPA)的调节控制下分泌,受到生物节律性、体液性及神经的调控。尽管当前大多实验室运用全自动生化仪器已能较为准确地测定
伴随着信息与通信等领域的迅速发展,大量的语音、图像等多媒体信息要进行存储、处理与传输,需要很大的存储空间和信道带宽。为了提高存储效率和减小存储空间,在允许的失真条件下
近年来,随着混凝土结构数量的不断增多和使用期的增加,混凝土结构中钢筋腐蚀造成的结构耐久性降低和结构破坏已日益成为一个严重的问题。用FRP(纤维增强塑料,Fiber reinforced p
采用文献资料法和专家访谈法对健身舞蹈功能体系进行阐述,分析影响中国当代健身舞蹈功能体系的相关因素,探索中国当代健身舞蹈功能体系构建的关键环节。主要结论:健身舞蹈功