【摘 要】
:
分类作为机器学习中基本的问题之一,受到了众多研究者的广泛关注。至今研究者们已提出了很多解决分类问题的模型和算法。其中有一类算法:稀疏核方法,应用于特征向量表示的分
论文部分内容阅读
分类作为机器学习中基本的问题之一,受到了众多研究者的广泛关注。至今研究者们已提出了很多解决分类问题的模型和算法。其中有一类算法:稀疏核方法,应用于特征向量表示的分类数据集中,在近几十年获得了巨大成功。这类算法均是基于二分类问题建立,无法直接应用于多分类问题。概率分类向量机(PCVMs)作为其中一个融合了支持向量机(SVMs)和相关向量机(RVMs)优点的模型,至今仍只能解决二分类问题。本文基于贝叶斯框架,通过公式推导和拓展,将二类版本的概率分类向量机模型推广至多类,提出了多分类概率分类向量机(mPCVMs)模型。同时提出了两种算法,自顶向下的mPCVM1和自底向上的mPCVM2。本文的主要工作如下:(1)本文提出的mPCVMs概率模型是仅支持二分类的概率分类向量机的推广。由于它是基于贝叶斯框架,相比SVMs类算法,需要指定的参数更少。mPCVMs概率模型使用截断高斯先验,使得模型权重的取值与对应的标签保持一致,避免了不可靠的基样本出现,解决了模型对核参数异常敏感的问题。在机器学习领域,现有的大部分多类模型的权重个数均会随数据集类别数增加而增加,而mPCVMs概率模型的权重个数不会随数据集类别数不同而变化。当类别数较大时,mPCVMs权重个数少,减少了优化算法的时间、空间消耗,提高了矩阵求逆运算时的数值精度。(2)本文提出了基于期望最大化框架的优化算法,mPCVM1。它通过极大化mPCVMs概率模型权重的后验分布,得到权重的最优取值。在优化过程中,mPCVM1初始时包含所有基样本,而在迭代过程中,逐渐删除冗余和不相关的基样本,达到稀疏的目的。由于这种从多至少的模式,我们称该算法是自顶向下的。(3)本文基于极大化mPCVMs概率模型的type-Ⅱ型似然,提出了增量形式的优化算法mPCVM2。mPCVM2在初始时仅包含一个基样本,在迭代过程中,逐渐增加、删除基样本,或修改基样本对应的权重。由于这种从一至多的模式,我们称该算法是自顶向上的。(4)通过理论分析和大量实验,本文验证了两个算法的有效性。尤其是当数据集的类别数较大时,本文提出的两个算法有明显优势。通过两个算法在各方面的对比,本文给出了在实际应用中,如何在两个算法中做出选择的建议。
其他文献
2030年之前在全世界的大范围内消除绝对贫困是《2030年联合国可持续发展议程》设定的主要任务之一。基于此议程与我国现阶段的实际情况,政府提出了保证中国农村地区贫困人口实现全面脱贫的政府工作目标,按照对贫困定义的现行标准,我国2020年所有贫困县都将全面摆脱贫困。在完成全面步入小康社会的工作目标后,脱贫攻坚和乡村振兴两大战略的政策衔接是值得研究的重要课题,农民合作社作为政府与贫困户、农民和市场之间
细胞表面的聚糖作为一种重要的结构和功能分子,参与细胞粘附、信号转导、免疫识别、分子运输等一系列重要的生物过程。细胞表面膜蛋白上聚糖的表达变化以及细胞表面聚糖特定
网络自制剧是伴随互联网技术的发展而产生的新媒体影视艺术形态。从早期低成本、粗制滥造的短小剧集,到如今众多巨额投资、精良制作的品质长剧,当前,国产网络自制剧已成为社会主流群体观剧的重要选择,影视业界与学界也对其投射了极大关注。目前国产网络自制剧进入平稳发展阶段,大量文本累积与创作经验显示出该剧种已具备独特且稳定的叙事特征。行业发展推动学理研判,目前学界积极关注与探讨网络自制剧这一理论命题是十分必要的
目的:羟基磷灰(HAP)是组成人体骨骼和牙齿的常见的重要的无机成分之一,近年来HAP是骨修复的研究热点,因其具有良好的生物活性及生物相容性,目前HAP作为一种常用的骨缺损修复材料被熟知。但是HAP的存在不总是有益的,大多数肾结石形成都与HAP相关,然而,HAP是如何促进肾结石的形成的,目前的研究还较少见,本研究探索了HAP对肾小管上皮细胞(HK-2细胞)凋亡影响及其机制,从而了解HAP在肾结石形成
随着经济由高速发展转入增速换挡期,单纯的要素驱动已经难以维持经济的持续稳定增长,创新驱动开始成为经济增长的新动力,这促使我国的经济增长动力由要素驱动向创新驱动转换。同时,我国经济的飞速发展又离不开政府的有力引导,那么,无论是在要素驱动经济增长的过程中,还是在创新驱动经济增长的过程中,政府对经济的干预,是否会对这两个驱动过程产生影响呢?如何会,那么政府干预力度的大小对这两个驱动过程的影响又有何区别?
随着高速铁路列控系统的自动化程度越来越高,列控车载设备成为列车安全运行、提高运行效率的关键设备。该设备是典型的安全苛求系统,其安全性对于列车的安全至关重要。由于软件是车载设备的主要组成部分,为了保证列控车载设备能安全可靠地工作,对车载设备软件进行测试是必不可少的一环。目前,对于车载设备软件的测试大多依靠专家经验人工编写测试用例,这种测试方法耗时较长,效率较低,且容易造成遗漏。对于系统结构和功能逻辑
解决辍学危机需要更好地了解学生辍学的原因。然而,找出辍学的原因十分困难。与其他形式的教学成就一样,中职学生的辍学受到与学生生活相关的一系列因素以及学生个人、家庭、学校和社会环境的影响。在许多概念模型中,辍学不是一种独立行为,而是从出生开始受到人生活多方面影响的一个过程。然而这些因素应该如何诠释导致学生辍学的近端机制,又应该如何干预存在潜在辍学风险的学生,让其继续完成学业。研究发现,所有辍学学生在不
随着小批量定制生产方式的发展,企业的生产模式逐步转化为按订单生产(Make to order,MTO)和按库存生产(Make to stock,MTS)的混合模式。定制件需要根据客户的实际需求才能确定,通常按照定单来安排生产;而通用件在同种甚至多种类型下的产品内具备一定的通用性。由于定制产品的结构不同,通用件在不同订单中的需求量与提前期均不相同,对于通用件的历史数据进行直接预测具有较大的不可靠性。
时间序列是重要的数据形式,对时间序列的有效分析和精准预测具有重要的现实意义。时间序列数据通常具有长期的复杂非线性和高波动性,传统的时间序列分析方法效果不佳,还面临
随着时代的发展,金融业改革创新的步伐不断加快,商业银行之间的行业竞争愈演愈烈。面对市场监管与内部风险的双重压力,如何寻求创新型盈利手段,以更好的应对财务风险成了当下商业银行脱颖而出的决胜点。作为创新发展型银行的代表,XW农商银行借助其规模发展不断壮大、盈利模式日益提升的优势,同时注重提升其财务风险管理的水平。因此,对XW农商银行财务风险管理的研究,不仅可以提升其面对复杂市场环境的竞争力,而且可以基