纠错输出编码方法的研究和应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:yuxuan1991
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
纠错输出编码(ECOC)是一种多类分类的集成学习方法框架,比单个分类器具有更好的分类效果。ECOC算法的研究至今仅有二十年时间,但已广泛应用于人脸识别、交通信号识别、微阵列数据分析等领域。纠错输出编码框架包含编码和解码两部分,相关的研究者主要针对这两个方面提出不同的算法理论,而研究的重点是编码部分。本文从编码和解码方面分别对纠错输出编码进行探索。在编码方面,本文介绍编码算法的重要性和种类。在分析一些经典编码方法的基础上,本文提出两个新的编码方法。(1)针对微阵列数据的自调节编码算法(SA-ECOC)。该算法针对微阵列数据高维小样本的特点设计了动态自适应的编码算法进行分类,即先生成初始编码矩阵,然后根据数据的分类难度基于迭代增加矩阵的列。该算法还提出一种选列的标准“距离间隔”,保证新加入的列对分类结果有提升。与DECOC等经典ECOC算法的对比实验表明,SA-ECOC分类准确率略优且更稳定。(2)个性化编码方法(CECOC)对数据样本的特点分析,为不同样本设计个性化编码矩阵。基于UCI数据集以及微阵列数据集的验证结果显示,CECOC方法比没有个性化编码的矩阵效果更好,且更稳定。在解码方面,本文介绍了解码方法的作用和种类,以及常用的几种解码方法。文中基于弱欧氏距离解码(AED)的多零倾向等不足,提出了新的解码方法:比例欧式距离解码(RED),并结合文中提出的编码算法完成了两个完整的新ECOC算法框架。
其他文献
随着互联网和信息技术的快速发展,人们的生活越来越便利。然而这也带来一系列的问题,比如近年来数字内容的版权保护、传输以及分发问题。故而信息安全引起了人们的广泛关注。可逆信息隐藏技术是目前解决信息安全的有效手段之一。它除了要保证嵌入信息的隐密性和可提取性以外,同时需要完全无损地恢复原始载体。可逆信息隐藏作为一种特殊的信息隐藏技术,与传统的信息隐藏技术(比如数字水印和隐写术)相比,它有其自身的优点。数字
资本管制是国家控制资本在本国资本账户的流入和流出,是国家经济宏观调控手段之一。随着世界经济全球化的不断深入,世界资本流动日益活跃。资本的活跃在给世界经济带来活力的
词语搭配是词语组合的习惯性出现,具有一定的共现频率、语法结构和语义透明性。词语搭配是人类自然语言知识的重要组成成分,在自然语言处理的各项任务中占有很关键的位置。词
大规模数据中心的能源成本迅速上升并且快速地超过了硬件本身的成本,数据中心的能耗问题成为日益关切的焦点,能耗管理成为现代数据中心重要的度量与设计标准。在典型的数据中
相比传统的电子式倾斜传感器,光纤倾斜传感器具有可复用、质量轻、灵敏度高、成本低等诸多优点。近年来,随着运动馆、游泳馆、商业高楼等大型建筑的兴建,地基健康的监测己逐
在全球治理格局重塑与我国治理结构转型的大背景下,基层治理改革由政府单一主体治理朝着多元参与治理的方向发展,“政社互动”成为地方特色的社会治理新模式进入实践与研究领
猪传染性胃肠炎(Transmissible gastroenteritis,TGE)是一种高度接触性肠道传染病,主要特征是引起仔猪呕吐,严重腹泻和致两周龄以下仔猪100%死亡率,给养猪业带来了巨大的经济
进化树的重建问题是进化生物学中的一个基础问题,也是一个生物学与计算机学相结合的生物信息学问题。进化树的重建问题旨在重建出一棵能够最真实描述物种间进化关系的进化树
信息加密是计算机网络安全研究中的重要内容之一,而密钥是加密算法中的可变部分,它很大程度上决定着.保密通信的安全。所以,通信双方如何在确定对方身份的同时达成会话密钥,
本论文从研究背景、项目的现状等对蔡李佛狮艺社管理系统进行分析,确定了论文的研究方向和研究工作;从业务分析中对系统问题的存在和狮艺社内的组织结构进行了分析,使用活动