【摘 要】
:
半监督学习是一种让学习器利用大量无标记样本来辅助少量有标记样本的学习模式,在理论和实际运用中均受到了广泛关注。协同训练是基于不同视图训练两个分类器来互相标记样本以扩充训练集的一个过程,属于半监督学习的范畴。基于不仅能考虑到现实世界中数据集的分布情况,还能有效利用数据中各视图间相关信息这些特性,协同训练在自然语言处理、模式识别等领域均得到了广泛的应用。然而,如何选择更可靠的样本加入训练过程,是目前待
论文部分内容阅读
半监督学习是一种让学习器利用大量无标记样本来辅助少量有标记样本的学习模式,在理论和实际运用中均受到了广泛关注。协同训练是基于不同视图训练两个分类器来互相标记样本以扩充训练集的一个过程,属于半监督学习的范畴。基于不仅能考虑到现实世界中数据集的分布情况,还能有效利用数据中各视图间相关信息这些特性,协同训练在自然语言处理、模式识别等领域均得到了广泛的应用。然而,如何选择更可靠的样本加入训练过程,是目前待解决的一个问题。聚类假设是指在相同类簇中的样本极有可能具有相同的类标记,而在这一假设下,大量的无标记样本可以帮助探明整个样本空间的数据分布情况。反之,若已发现某数据集的空间结构,则能帮助确定类别决策边界较清晰的无标记样本,即训练可信度高的样本。因此,本文从协同训练自身存在的问题出发,借助聚类方法的最新研究和进展,提出了三种基于聚类优选样本的协同训练方法,完成的主要工作如下:(1)针对协同训练算法不能直接应用于单视图数据,且在迭代过程中加入的无标记样本隐含有用信息不够的问题,提出了基于核均值漂移聚类的改进局部协同训练算法。该方法利用改进局部协同训练算法得到一个完整视图分类器和另一个由高价值特征子集训练的局部视图分类器,然后采用核均值漂移算法选择聚类过程中指定带宽范围内的样本,从而得到隐含较多有用信息的无标记样本。(2)针对协同训练算法在迭代过程中加入的无标记样本隐含有用信息不足和多分类器标记不一致的样本导致分类错误累积的问题,提出了结合虹吸平衡自适应密度峰值聚类和共享子空间的协同训练算法。该算法基于虹吸平衡法则进行密度峰值聚类,并从簇中心出发推进式选择相互邻近度高的无标记样本交由分类器标记,然后利用多视图分解的共享子空间训练一致性分类器,以此来确定标记不一致样本的最终类别。(3)针对如何结合样本置信度和数据空间结构来选择更可靠的无标记样本,提出了基于改进密度峰值聚类的协同训练算法。该算法利用加权虹吸平衡法则确定数据集的簇中心后进行初聚类,再通过归类置信度等级划分策略监测归类模糊性高的样本,实现对其的归类自校正。最后根据归类置信度等级梯度获得的置信点、低模糊点和高模糊点依次添加到两个基分类器中,以达到协同优化的目的。本文在标准UCI数据集中,通过多组对比实验对提出的三种算法模型进行了实验仿真,实验证明了所提算法的有效性和更高的模型评价能力。
其他文献
目前,肺炎的诊断手段主要是依靠影像科医生对胸片进行人工判断,但是人工判断对专业水平的要求较高,也容易受到医生个人主观意识和身心状态的影响,尤其在医院环境下的影响更为显著。同时由于胸片二维投影的特点,体内各种脏器重叠,容易导致误判。因此使用一种准确率较高,能自动诊断的应用来辅助医生就拥有了重要的应用场景。本文在基于卷积神经网络最新相关技术的基础上构建了针对胸片图像的肺炎识别模型,主要工作如下:(1)
本研究在整理模型相关文献综述以及解读模型本质的基础上,结合化学学科特点,采用文本分析法、文献分析法、对比研究法对比分析了我国人教版高中《化学必修》(2019)与美国基础化学教材《Essencial Chemistry》(2018)中的模型。通过表格和柱状图主要从模型的数量、模型的类型、模型的表征方式、模型的呈现位置和模型的呈现形式几个角度进行了比较分析。从而得出如下结论:第一,模型数量上,美国基础
随着人工智能的发展,多智能体系统的一致性逐渐引起了许多研究者的关注。饱和约束普遍存在于各类实际系统中且智能体网络中不可避免的存在时延现象。因此本文重点研究了饱和约束、通信时延以及输入时延对多智能体系统完全一致性或滞后一致性的影响。研究了带有输入饱和约束的一阶离散多智能体系统的群体共识问题。根据竞争与合作的关系,设计了一种新的控制协议,以实现分组一致。将图论知识与Lyapunov定理相结合,给出了一
2013年教育部启动了普通高中课程修订方案,2017年教育部正式颁布了新的《普通高中化学课程标准》,2019年全国开始使用以该课程标准为依据编写的新版高中化学教材。本文主要采用了文献研究法、比较研究法、个案研究法对我国人民教育出版社(以下简称人教版)高中化学必修教材与美国化学教材《Essential Chemistry》的教材结构和内容设计进行对比,分析了两国高中化学教材的异同点,通过比较分析得出
教师专业发展的重要途径之一就是教学研究,这要求教师要把教学提升到学术的高度来进行研究。然而,将教学和学术研究等同起来是起源于高校,有关于教学学术的研究主要是在高校的领域进行探讨,研究中学教师教学学术的文献较少,尤其是对于化学教学学术的研究更是寥寥无几,因此有必要对中学的化学教师教学学术进行研究。本研究在梳理了国内外相关文献的基础上,参考了相关专家的意见,设计了“初中化学教师教学学术水平现状”的调查
在西方科学教育者对学习进阶的研究取得一定的成果后,国内教育者也逐渐认识到学习进阶的重要作用,开始研究学习进阶。目前我国对学习进阶理解的主要观点是:学习者通过对核心概念递进式的学习,从较低水平上升到较高水平,最终达到学习目标的一种学习理念。单元教学设计是连接课程标准与课时教学的桥梁,能够把零散复杂的知识运用核心概念整体设计和系统梳理。因此,可以将学习进阶理念与单元教学设计相结合,利用学习进阶理念梳理
教会学生学习、培养学生的学习能力已成为关注的焦点问题。让学生掌握学习方法,能独立自主的处理问题,能够调控自己的学习行为,一直以来是学校教育力求到达的目标之一。高中化学知识种类繁多,内容相对困难,要想成功完成化学学习活动,提高学习效率,就必须有正确的学习方法。因此,有必要对高一学生的化学学习方法进行研究,发现其中的不足,从而有针对性地提出一些优化建议,进而为重庆高中化学教师有效地开展化学教学实践活动
热管理技术在现代光电子领域是极为重要的一部分。垂直外腔面发射激光器(vertical-external-cavity surface-emitting lasers,VECSELs)综合了固体激光器与半导体激光器的优良性能,能同时获得较高的输出功率及理想的光束质量,且发射波长可以根据实际需要进行设计,在自由空间光通信、非线性频率变换、激光光谱学等方面具有重要应用。与其他任何种类激光器一样,VECS
HCl,CO是工业生产产生的卤化物和碳氧化物,NH3则是许多化工产品的生产原料,在化工化肥、制药、纤维合成等领域都有广泛应用,但它们同时也是有毒气体,中毒者严重时会危及生命。因此,有害气体之探测急需得到广泛关注。半导体气敏传感材料因具有优异的工程稳定性被用做气体探测。鉴于传感材料与被探测气体间是多对一的关系,换句话说,即便是对同种气体进行探测,选择不同材料,我们都将得到不同的探测响应。在本论文中,
随着国家的进步,社会对人才的需求日益旺盛,教育部制定并颁布的课程标准对人才的培养目标发生了变化。目前,仅仅强调“题海战术”已经不能实现对学生物理学科核心素养的培养,如何分析高考试题、发现试题规律以及命制高质量的试题是中学物理教学有待解决的问题。本文通过分析2017年的课标、最新《考试大纲》、2010到2020年全国各省高考真题和人教版高中物理教材等,发现电磁感应知识是高中物理的重难点,也是每年高考