鲁棒自适应机器学习方法及应用

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户：chaska

【摘要】

：

【作者】

：

张佳铭

【机构】

：

中南财经政法大学

【出处】

：

中南财经政法大学

【发表日期】

：

2021年01期

【关键词】

：

在线学习最优反馈控制核模型深度学习优化器样本选择模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,伴随着计算机技术的兴起,大数据和云计算逐渐走进人们的视野,海量的数据和我们的生活变得息息相关。当数据存在异质性且受到复杂的噪声干扰,样本量很大甚至以流式数据的方式呈现时,传统的数据分析方法和统计模型面临着诸多挑战。一方面模型需要进行修正以适应复杂的数据结构,另一方面无法一次性导入内存的数据迫使算法必须依据少量多次获取的样本进行学习。在这一背景下,设计出满足实时更新需求的自适应学习算法以弥补已有方法的不足,成为当今获得广泛关注和应用的热点问题。本文将最优控制方法融入到机器学习的研究中,创新性的建立了一个基于最优反馈控制在线学习框架,并在该框架下提出了一系列用于解决线性和非线性的分类与回归问题的鲁棒自适应学习算法。进一步地,该算法被拓展到时下热门的深度学习领域,应用于图像识别和文本分类。此外,本文还将改进的深度学习算法与传统微观计量模型相结合,实现了全新视角下样本选择问题的研究。本文的主要工作概括如下:第一,构建了基于最优控制的鲁棒在线学习架构,分别讨论该架构下的线性回归、二分类和多分类问题。首先在线学习被转化为状态反馈控制问题,接着使用线性二次型调节器（linear quadratic regulator,LQR）获取最优的参数更新。对未知参数较少的低维情形,使用迭代方法求解Riccati方程,并将对应算法命名为OLQR（online linear quadratic regulator）;对于更为常见的高维问题,本文提出ROHDL（online high dimensional learning algorithm）算法,通过极分解大大简化了计算量。OLQR和ROHDL算法相对于经典方法可以获得更快的收敛速度和更好的预测精度,当噪声结构较为复杂时这一优势更为明显。与相关算法的对比实验也证实了所提出算法的优越性。第二,将上述线性问题的架构拓展到非线性回归与分类问题。借助核技巧,非线性学习本质上仍然可以看成有限维系统的一系列状态反馈控制问题。选取固定带宽的高斯核作为核函数,本文提出了一种适用于非线性回归的OKLQR（online kernel linear quadratic regulator）算法。进一步地,考虑到实时数据常常包含结构性的变动,因此固定带宽的核函数存在一定的缺陷,本文提出改进后的OAKL（online adaptive kernel learning）和CAOKC（control-based adaptive online kernel classification）算法,将带宽也作为需要在线更新的未知参数,分别解决非线性的回归与分类问题。大量对比研究表明,该方法相较于当前相关算法在收敛速度、预测精度和对噪声的鲁棒性方面都存在一定优势。第三,提出了基于控制的深度学习优化器CSGC（control-based stochastic gradient descent compression）。深度学习一般需要较多的样本才能完成训练,而每次参数更新仅涉及少量样本,本质上也是一种在线学习,本文所提出的架构依然适用。深度神经网络往往包含较多的未知参数,依据前文所述的框架可以得到一个包含网络中所有未知参数的完整的状态反馈系统。接着根据神经元的连接方式将这些参数分割为若干组,完整的系统也据此分为对应的线性子系统,这些子系统和ROHDL类似,利用极分解技巧就可以进行快速更新。本文给出了CSGC优化器的收敛性与收敛速度相关证明,以论证算法的有效性。与主流的利用一阶信息的梯度方法相比,CSGC不仅继承了控制算法收敛快、预测准确率高的特点,而且可以一定程度上缓解梯度消失问题。在模拟数据、图像识别和文本分类任务上与现有优化器的对比实验也证实了该算法的优越性。第四,基于深度学习的思想,本文提出一种深度学习视角下的样本选择模型（deep sample selection network,DSSN）。该方法对传统的Tobit-I和Tobit-II模型进行了重新解读,分别构建了深度Tobit-I网络和Tobit-II网络,并对模型中变量的显著性水平进行度量。在构建过程中灵活运用了残差神经网络（Res Net）和长短期记忆模型（Long Short-Term Memory,LSTM）等经典深度学习模型中的部分技巧,分别实现了传统Tobit-I和Tobit-II模型的相应功能,并使用CSGC作为优化器进行求解。与经典的样本选择模型相比,一方面深度样本选择网络能够在依赖较少假设的基础上,充分挖掘、量化大样本数据背后的微观决策过程,可以更好的识别显著的变量。另一方面,由于更复杂的网络包含更多的未知参数,样本选择网络在拟合效果和预测精度上都有着显著的提升。数值模拟和实际经济数据也证实了该方法的有效性。本文创新点有:（1）提出一个完整的基于二次型最优控制的在线学习框架,在该框架下预测误差得到指数收敛,并且解决了控制算法计算复杂度较高、难以应用到高维场景的缺陷。（2）在深度学习中兼顾收敛速度和计算精度的优化算法寥寥无几,本文将二次型最优控制的在线学习框架应用到深度学习中,保留了控制算法具有的鲁棒性、收敛速度快、预测精度高等特点,为将来深度学习优化算法的设计提供了灵感。（3）本文利用深度神经网络中的一些特殊结构和技巧构建了两种不同的深度样本选择网络,充分利用了神经网络在微观计量建模中的特有优势。一方面,网络不需要对随机扰动项的分布做出任何假定,这极大的保证了模型的灵活性和泛化能力;另一方面,网络没有对参数化结构做很强的限制,因而在从大样本、非线性性数据提取信息上有着更好的效果。（4）已有研究尚未将机器学习和经济学理念很好结合,本文结合样本选择问题的经济学理念和计量模型的可解释性来构建新的模型,避免了生硬的套用机器学习方法。这种创新的尝试也为机器学习等数据科学方法与计量经济学、经济统计学的融合发展提供了全新的思路。综上所述,本文以最优反馈控制的角度为在线学习方法构建了一个全新的理论框架,在这一框架下,分类、回归和深度学习等在线学习的常见任务都可以获得更为稳定的学习效果,并且具有巨大的拓展潜力和研究前景。另外,本文提出的深度样本选择网络模型不仅能够更为细致的量化微观计量经济问题,而且也为利用人工智能技术来发展改进社会科学的实证方法提供了新的工具与思路。

其他文献

互联网时代我国主流意识形态话语权建设研究

互联网时代我国主流意识形态话语权建设,关系到马克思主义在全社会精神思想层面的指导地位,关系到中国共产党执政地位和无产阶级社会主义国家政权的巩固发展,关系到社会主义现代化强国目标和中华民族伟大复兴“中国梦”的最终实现,不仅是一项极端重要的“生命线”工作,更是一场必须打赢的“软实力”战争。本论文分析了在互联网信息技术发展突飞猛进,中国特色社会主义进入新时代的关键历史阶段,我国主流意识形态话语权建设面临

学位

互联网时代主流意识形态话语权

复杂工况耦合下的水润滑橡胶轴承润滑特性与噪声研究

本论文在国家自然科学基金项目“大尺寸水润滑橡胶轴承振动噪声机理与可靠性研究”（51175521）和国防基础科研项目“高可靠低噪声XXX设计理论与方法（B14XXX）”的支持下,针对水润滑橡胶轴承系统面临的进一步提高承载能力与抑制摩擦噪声等性能要求,综合应用摩擦学、流体力学、接触力学、热力学等理论,通过建立高承载、低转速、轴向流、轴倾斜等复杂工况下的水润滑轴承流固热耦合混合润滑模型,着重对水润滑橡胶

学位

水润滑橡胶轴承复杂工况耦合混合润滑摩擦噪声复模态分析

21世纪中日双边认知研究 ——基于《人民日报》和《朝日新闻》（2001-2019）的考察

双边认知是两国关系的晴雨表,长期以来影响中日关系的热点问题错综复杂,中日双边认知在其中起到关键作用。小泉参拜靖国神社使中日关系倒退,“一带一路”框架下中日竞合关系突显,二者都呈现出认知的动态过程,前者表现出中日间的负面认知,后者表现出中日间的正面认知。本论文选择两者作为研究21世纪中日双边认知的案例。中日主流媒体是了解双边认知的窗口,本论文通过对《人民日报》和《朝日新闻》的考察,在新古典现实主义和

学位

中日认知靖国神社一带一路人民日报朝日新闻

外资进入对企业嵌入全球价值链位置影响研究

从1978年党的十一届三中全会召开至今,中国改革开放的步伐已经走过了四十余年,中国也已经成长为世界制造业大国。伴随着对外开放程度的扩大,大量外资的进入对中国的经济与贸易产生了深远的影响,外资进入不仅给国内市场提供了大量的就业岗位,提高了工资水平,还拉动了中国出口的高速增长,创造了中国的出口奇迹。与此同时,世界经济逐渐步入全球价值链时代,在以价值链为主导的全球化生产背景下,中国通过自身的经济发展和引

学位

外资进入全球价值链位置外商直接投资溢出渠道

传统音乐与舞蹈文化传承之“湘北经验”

当代传统音乐与舞蹈文化传承的根本力量来自教育，高校势必需要承担起主体责任。湖南理工学院以学科与专业建设为平台，同时联合政府行政机构、民间社会力量，构建“产学研”一体化机制的经验，为湘北地区传统音乐与舞蹈文化的传承与保护提供了一条可行路径。

期刊

传统音乐与舞蹈文化传承高校学科与专业产学研

内陆自贸区设立对区域经济增长与开放促进研究

2017年3月31日,中国四个内陆省份（河南、湖北、四川和陕西）的10座城市和一个内陆直辖市（重庆）,以及省份沿海但省会位于内陆的辽宁省沈阳市,成为中国第三批设立的自由贸易（试验）区（以下简称“自贸试验区”或“自贸区”）。这是自2013年实施自贸区战略以来,中国首次在内陆地区设立的与前两批沿海自贸区在法理意义上完全相同的新型特别经济区。此后的2019、2020年,中国又陆续在另外4个内陆省份（云南

学位

内陆自贸区(自由贸易(试验)区)经济增长贸易额外商直接投资

郭象群己和谐思想研究

本文按照从“独化”的个体到群己和谐的“玄冥之境”的脉络,分三个板块来阐述郭象的群己和谐思想,这三个板块分别是:出发点、个体观、群体观。从“横”和“纵”两方面来呈现郭象的哲学思考,“横”的方面即境遇这种“共在”的视角,“纵”的方面即历史视角。全文以“独化”这个郭象哲学中最基本的范畴为起点,通过“自生”、“自性”、“相因与相与”、“神器独化于玄冥之境”等范畴,把郭象哲学串成一个连贯的系统,呈现出从个体

学位

自性独化逍遥群己和谐郭象

现代汉语助词的认知运作机理研究

现代汉语助词（以下简称为助词）作为具有汉语本土化特征的一类词,从二十世纪四十年代开始便受到了语言研究者的密切关注。诸多学者从语义视角、句法视角和语用视角对助词进行过探究,为助词研究做出了许多贡献。不过,迄今为止,很少有学者将助词看作一个整体进行研究,并建构统一的理论框架对助词的运作机理展开系统深入的分析。本研究试图在这方面做出探索。本文在后现代哲学的背景下,以生成整体论为指导,依据助词的特点建构一

学位

现代汉语助词SRM生成机理识解机理凸显/限定

智能汽车人机共驾信息物理建模及控制方法研究

智能汽车作为国内外争相研究的热点,由于交通环境的复杂性、技术的可靠性以及法律法规等条件的约束,在未来很长一段时间内仍需要人和机器共同完成动态驾驶任务,称之为人机共驾。目前,人机共驾面临的挑战在于如何解决低级别自动驾驶的个性化人机交互和中高级别自动驾驶的复杂环境适应性问题。因此,通过学习人类驾驶员的偏好及优秀的驾驶经验,对于提高智能汽车市场接受度和适用性具有重要意义。论文基于智能汽车人机共驾的发展现

学位

人机共驾驾驶员行为建模类人驾驶策略信息物理系统

铜-铝板电磁脉冲焊接瞬态过程及接合机理研究

铜-铝复合构件可以充分发挥铜、铝两种金属的互补优势,弥补单一金属构件的性能缺陷,从而有效提升构件的综合性能,降低其综合成本,在电动汽车、电力设备、电子信息等领域具有广阔市场前景,对于促进制造业提质升级、助力实现“碳达峰”和“碳中和”的战略目标具有重要意义。然而,铜与铝在熔点、比热容、线膨胀系数等物理性质方面差异显著,熔焊等传统方法易形成脆性的金属间化合物,其有效性和适应性存在明显缺陷。如何实现铜、

学位

电磁脉冲焊接铜-铝板焊接瞬态过程金属射流微间隙放电

鲁棒自适应机器学习方法及应用

其他学术论文