基于图约束的模型学习研究

来源 :广东工业大学 | 被引量 : 3次 | 上传用户：rfy68213919

【摘要】

：

【作者】

：

孙为军

【机构】

：

广东工业大学

【出处】

：

广东工业大学

【发表日期】

：

2020年01期

【关键词】

：

约束模型数据分析机器学习降维方法投影矩阵多视角结构信息局部结构特征抽取自适应权重框架处理数据

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，机器学习理论和应用正以惊人的速度发展并改善着人们的生活，目前机器学习算法已经广泛应用于民生、医疗、安防以及国防等领域，例如基于人脸识别的门禁和安防系统、基于指纹识别的支付系统、图像检索以及谷歌在研的无人驾驶汽车等等。随着计算机硬件、网络以及相关数据采集设备的快速发展，给人们获取丰富的数据资源带来了极大的便利，大量的数据含有丰富的信息，原则上应有助于机器学习学习到更合理的模型，但是丰富的数据也带来了数据复杂性的提高、信息过量和数据冗余等问题，甚至部分数据由于不规范的采集方式或恶劣的采集环境会出现大量的噪声，这些数据尽管信息丰富但知识匮乏，直接对其进行分析不仅效率低下，而且由于冗余特征和噪声数据的存在而难以学习到一个鲁棒的模型。如何针对不同的任务，从中提取出最有价值的信息进行分析成为了机器学习和模式识别领域的重点和难点。
　　从数据中抽取有用信息的过程我们称之为特征抽取，一种有效的特征抽取方法不仅能够极大地降低数据的维数从而提高算法效率，而且有助于针对不同的任务学习到更鲁棒的模型从而提高模型的泛化能力，因此特征抽取算法的研究具有重要的意义。目前，基于图约束的模型广泛应用在数据的模式抽取与分析中，但是，由于处理数据可能来自于单视角或者多视角，因此数据的复杂性给数据分析带来了新的挑战。尽管这些方法在数据分析上取得了不错的效果，但是他们都含有一些明显的缺点:(1)大部分降维方法仅仅使用单一的投影矩阵将高维数据映射到低维子空间中，投影需要在保留数据重要特征和内部结构的同时去学习低维子空间，这样单一投影矩阵在处理数据时压力过大，可能会影响到降维的准确度和原始数据全局或局部结构的保持;(2)大多数方法把数据的图学习和模式抽取分开在两个不同的步骤，即先利用数据的局部几何结构信息构建图，然后再进行投影学习以抽取有效的数据模式，但是如此两个分开的步骤难以保证构建的图适合数据的模式抽取，因此很难保证算法的整体最优。(3)大多数方法仅仅考虑单视角图学习，随着数据的规模和种类的增加，构建的图也会多种多样，目前的方法很少利用多图学习来构建一个正确的图，进而准确地刻画数据的结构，进而进行有效的数据分析。(4)大多数方法在数据分析的过程中没有消除数据噪声的影响，因此模型的鲁棒性较差。
　　本论文以基于图约束的模型作为学习对象，利用图嵌入技术，围绕上述的缺陷，提出一系列新的模型，来提高基于图约束模型的学习效率和鲁棒性，同时拓展单视角图嵌入技术到多视角环境下，进一步提出多视角图嵌入技术，以进一步扩大处理数据的范围。具体来说，有以下一些方法:
　　首先，本文提出了一个自适应局部保持的鲁棒鉴别分析框架，该框架同时进行图的学习和数据特征抽取，因此可以保证算法整体的最优。具体地说，该框架具有以下优势:首先，该框架利用一个稀疏的矩阵拟合数据的噪声信息，进而提高模型的鲁棒性;其次，该框架通过使用数据的局部结构信息和标签信息来指导投影学习，同时自适应地学习一个局部结构图来约束模型，以回避过拟合;最后，该框架学习另外一个投影矩阵来保持数据的鉴别信息。除此之外，该方法通过对投影矩阵施加L2,1范数约束，使得该模型在特征抽取过程中可以自适应地选择最重要的特征。大量的实验表明该方法可以抽取更加鉴别的特征，可以有效提高分类准确率。
　　然后，本文提出了一种新的无监督降维方法，即松弛的稀疏局部保持投影方法。该方法不再使用单一投影矩阵，而是使用两个投影矩阵来减轻单一矩阵处理数据时所承担的压力，使得这两个矩阵具有更大的自由度，能够更好的保持投影数据的稀疏性和局部结构，减少降维过程中样本的信息丢失。通过施加稀疏表示来学习两个投影矩阵的相似矩阵，将局部结构以线性方式保留下来。因此，这两个投影矩阵应该具有相似结构，即数据的局部流形结构。为了解决算法优化问题，我们还提出了一种有效的快速收敛的迭代算法。在六个数据集上的实验结果证明了该方法的有效性。
　　最后，本文提出了一个新颖的基于差异性提升的多视角图学习方法，进一步拓展单视角图学习到多视角图学习，并应用于半监督学习。具体来说，该方法对每一个视角数据构建一个图，并且利用自适应权重线性逼近技术使得每一个视角图可以自适应地逼近最终的统一的图，使得最终学习到的图不偏离每一个视角图。该方法同时把图学习并入到数据标签传递的模型中，进而构建一个联合多视角图学习和标签传递的广义框架。为有效减少信息的冗余，该框架进一步考虑每一个视角图的差异性，通过自适应权重系数来有效区分相似的视角图，并为差异性较大的视角图赋予更大的权重，从而保证最终学习到的图可以准确地刻画数据的内在几何结构。大量的实验表明，该方法不仅可以学习一个准确的图，而且能够准确地传递数据的标签。

其他文献

南京市会计代理行业存在问题与改进措施

摘要：基于对南京市代理行业生存现状调查的基础上，分析会计代理行业在发展过程中面临的机遇和挑战，同时对会计代理行业今后的发展提出建议和对策。　　关键词：会计代理；会计核算；会计监督；会计电算化　　中图分类号：F230 文献标志码：A 文章编号：1673-291X（2014）12-0127-02　　近年来，随着中小企业快速发展，会计代理记账作为新颖的会计解决方案和新的社会性会计服务行业，逐渐成为中小

期刊

天津会展业发展现状及对策研究

摘要：会展业是现代服务业的重要组成部分，产业关联度高，辐射带动力强，集商品展示交易、经济技术合作、科学文化交流于一体，具有经济增长“加速器”、城市发展“助推器”、城市形象“传播器”、劳动就业“吸纳器”的功能，对于加快城市建设力度、提升城市品位和知名度、促进城市经济增长方式转变具有重要作用。在借鉴国内外主要经验的基础上，结合天津会展业发展的实际情况，提出加快推进会展业发展的对策建议。　　关键词：会

期刊

物联网商业模式的问题及对策研究

摘要：现今物联网应用领域十分广泛，对于推动经济发展、加快中国经济发展体制的转型、提高中国自主创新能力发挥着重大作用，它已成为当前最具发展潜力的产业之一。但是产业发展中仍然存在障碍。中国的物联网产业仍然处于初级阶段，成熟、稳定、有利可图的商业模式还没有形成。物联网作为一个全新的研究领域和研究对象，它的商业模式的创新才是决定物联网产业大范围、长期应用的关键所在。介绍从现存的物联网模式展开分析，并提出

期刊

湖南制造业出口竞争力提升及其对策

摘要：基于生产函数理论模型，理论构建了含出口变量及其滞后项的随机效应面板分布滞后模型，以探讨湖南制造业出口竞争力问题。实证结果表明，湖南制造业存在规模经济效应，出口的贡献率仅约为10.59%。出口及其滞后项变量、总资产、劳动力增加将推动制造业总产出水平扩张，出口变量的边际影响值之和为0.13；出口变动对制造业总产出水平波动的长期乘数效应值为1.15。出口对制造业产出水平的影响存在时滞效应，滞后阶

期刊

工会未来职能的探讨

摘要：知识经济时代，人力资本对企业的影响日趋突显，在一定程度上决定着企业的核心竞争力。尤其在经济一体化的今天，劳动力流动的增强以及产品更新换代的加速，对企业能否留住人才提出了严峻的挑战。近年来，企业逐步认识到核心员工对企业发展的重要性，通过对人力资源进行有效的开发与管理，满足员工的需求，进而调和劳资关系。但这只是劳资关系的阶段性改良，没有工会参与的劳资关系，难以实现真正意义上的和谐。新形势下，工

期刊

基于“旅游增长极”视角的陕西体育旅游产业发展战略研究

摘要：从“旅游增长极”视角对陕西省体育旅游产业的发展战略进行全面的规划设计：首先，根据陕西体育旅游资源与发展现状提出“一心三部双核联动”的发展战略；其次，对陕西省发展体育旅游的时空发展顺序进行详细阐述；最后，以市场为主导设定了陕西省三个核心区体育旅游发展主题。借此为陕西体育旅游产业的发展战略的制定提供依据，推动陕西的社会经济文化发展，改善人民生活质量。　　关键词：“旅游增长极”；体育旅游；发展战

期刊

浅谈会展专业人才职业素质提升研究

摘要：近年来，伴随着会展业的快速发展，中国会展专业人才教育与培训取得了突破性的进展。然而，中国会展专业人才的供给短缺问题仍然没有得到有效缓解，一方面会展业界仍然大呼人才短缺，另一方面会展专业毕业生却求职无门。从《商务礼仪》课程教学内容、企业需求、学生感知等角度出发，探讨会展专业人才职业素质提升的有效途径。　　关键词：会展专业人才；职业素质；《商务礼仪》　　中图分类号：F240 文献标志码：A 文

期刊

敦奥运报道模式探析

摘要：从1996年的亚特兰大奥运会开始，都市类报纸就逐渐渗透到奥运赛事报道中，悉尼奥运会时就有诸多地方性都市类报纸派出各自得力干将亲临赛场采访报道，雅典、北京和伦敦更是达到了峰值，但采访条件的限制、整合编辑能力的欠缺、信息的同质化、网络和电视媒体的冲击、时差等因素总是困扰着诸多的都市类报纸。云南的生活新报通过构建媒体联盟、强化本土、做足深度、强化与读者互动等扬长避短，受到同行肯定。在此对其模式进

期刊

小样本心音分类方法研究

心音分类可用于检出异常心音、发现心血管病患者，在心血管病诊断方面能发挥重要作用，是基于心音信号的心血管病自动诊断领域的主要研究热点，吸引了众多国内外学者的研究兴趣。传统上基于经验选择心音信号特征以执行分类任务的方法，存在有效特征获取难、分类效果欠佳等不足。随着人工智能技术的发展，近年来深度学习已成为研究心音分类的主流方法，在分类性能上取得了较大提升。基于深度学习的心音分类网络一般都基于较大的神经网络所建立，需要大量训练样本来优化其权值。但是，现实中采集大量的心音数据是困难且昂贵的，从而导致难以获取充足的心

学位

小样本心音分类方法分类网络数据降维深度学习稀疏过程分类问题低维分类效果非负矩阵分解

旅游专业本科精品人才培养模式的重组策略

摘要：实现世界旅游强国的战略构想为当前的旅游高等教育人才培养提出了新的挑战。旅游专业本科教育需要构建和优化精品人才的“培养链”。建立系统的精品人才培养体系涉及目标体系、内容体系、运行体系和评价体系等，其全过程必须贯彻和体现“精品”生产的意识和理念。　　关键词：旅游本科；精品教育；培养模式；人才　　中图分类号：F240 文献标志码：A 文章编号：1673-291X（2014）12-0239-03　

期刊

基于图约束的模型学习研究

其他学术论文