基于核的算法与生成模型研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:XA1093815462
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
核方法是机器学习领域的经典模型之一,其原理是将输入的原始空间的特征映射到高维甚至无穷维空间中,并在高维空间学习得到对应的线性模型,使模型具有极强的非线性表达能力。核方法在回归、分类等任务上都有广泛的应用。作为理论较为完备的机器学习算法,其在不同场景下仍有许多亟待解决的问题:(1)在多输出回归应用中,核方法极大提升了模型的非线性表达能力,但同时导致模型的灵活性受限,尤其在处理多个输出相关性问题上,显得能力不足;(2)通常基于核方法的判别模型处理样本个体为单个样例,当处理单个样本为一个集合数据的学习任务时,现有的核方法未能很好解决;(3)在元学习思路下的小样本学习任务中,选择基于核方法的判别模型作为基础学习器,如何构建数据驱动的自适应核以有效提升小样本学习的性能,是一个值得研究的问题。针对上述挑战性问题,本文以核方法为基础,研究在多输出回归、集合匹配以及元学习框架下基于核的相关算法,并分别提出三种模型,在一定程度上解决了核方法在不同学习场景下的有效使用问题。其中,在研究元学习范式下核方法的相关算法时,使用变分推断的方式获得核函数的谱分布。由此本文对推断问题进行拓展,研究基于流结构的推断生成模型,并结合图像生成任务,解决了基于流结构的有条件生成问题。本文的具体工作包括如下四方面。
  1.核化的结构化支持向量回归模型:为了显式描述核化的多输出回归模型输出的相关性,提升模型的判别性能,本文提出一种简洁有效的两层模型,命名为结构化支持向量回归模型。其中,模型的第一层是非线性映射层,该层主要依赖核函数中包含的隐式复杂非线性映射函数,从而使得模型能够较好的处理输入和输出之间复杂非线性关系。模型的第二层是显式的相关性学习层,基于组稀疏的线性结构,能充分考虑多个输出的相关性以及多个输出之间存在的结构化信息,极大增强了模型的表达能力。同时,方法在模型训练过程引入流形平滑项以提升模型的鲁棒性。本文提出交替迭代优化算法来求解该目标函数,并对其收敛性进行分析。在多个公开的多输出回归数据集以及实际应用场景下的医学指标回归任务上的实验结果,验证了该模型的有效性。
  2.基于多核学习的深度匹配核模型:为了有效解决集合匹配问题,本文提出一种新的加性深度匹配核模型来实现集合之间的直接匹配度量。该模型包含两个层次的核:局部核和全局核。本文选择基于深度神经网络的深度核作为基础的局部匹配核,利用局部匹配核以有效的度量集合内元素的相似度。通过引入锚点,算法可以利用有监督的多核学习将多个局部匹配核融合在一起,得到集合之间的全局匹配核。该模型具有计算速度快,并且不依赖于特定的分布或几何结构假设等优点。在基于视频的人脸识别,动态场景识别,以及多视角物体识别三个视觉分类任务数据集上的实验结果,验证了该模型的有效性。
  3.基于自适应核的元学习模型:为了融合核估计技术和元学习思想,实现将核方法向到元学习设置下小样本学习的拓展,本文提出一种新的元学习框架。该模型研究在元学习框架下的基于随机傅里叶特征的核估计技术,实现了以数据驱动的方式,从数据中推断针对当前任务的自适应核。在模型设计阶段,创新地将求解过程转化为求解一个变分推断问题,并且导出新的变分下限(ELBO)。同时,模型通过引入基于LSTM的上下文推断方式来增强其从多个任务中获取有效共享信息的能力,从而得到信息更加丰富的特征。本模型构建的自适应核函数具有表达能力强、采样率低等优点,可在测试阶段快速适应新任务进而提升模型性能,且模型的良好性能在小样本回归和小样本分类实验上得到了有效验证。
  4.基于流结构的条件生成模型:相较于基于变分推断的生成模型,基于流结构的生成模型具有直接估计准确的似然函数的优势。但当前基于流结构的生成模型未能较好解决条件生成问题。针对此问题,本文提出一种新的基于流结构的生成模型来处理条件生成任务。该模型包含两个可逆神经网络和一个关联网络,并在训练过程中将输入向量和真实输出向量映射到隐含空间,分别得到两个隐含变量。该模型的优势是在给定输入向量时,输出向量的条件分布可简化为求解两个隐含变量之间的条件分布。此外,本文考虑拓展模型的功能,使其能够处理在给定另一个域的额外信息的情况下,实现对输出向量的操控。本文在脑图像的模态转换任务上的实验结果,充分验证了模型的有效性,在自然图像上的“风格转换”任务上的实验结果,初步验证了模型的通用性。
其他文献
摘 要:从“旅游增长极”视角对陕西省体育旅游产业的发展战略进行全面的规划设计:首先,根据陕西体育旅游资源与发展现状提出“一心三部双核联动”的发展战略;其次,对陕西省发展体育旅游的时空发展顺序进行详细阐述;最后,以市场为主导设定了陕西省三个核心区体育旅游发展主题。借此为陕西体育旅游产业的发展战略的制定提供依据,推动陕西的社会经济文化发展,改善人民生活质量。  关键词:“旅游增长极”;体育旅游;发展战
期刊
摘 要:近年来,伴随着会展业的快速发展,中国会展专业人才教育与培训取得了突破性的进展。然而,中国会展专业人才的供给短缺问题仍然没有得到有效缓解,一方面会展业界仍然大呼人才短缺,另一方面会展专业毕业生却求职无门。从《商务礼仪》课程教学内容、企业需求、学生感知等角度出发,探讨会展专业人才职业素质提升的有效途径。  关键词:会展专业人才;职业素质;《商务礼仪》  中图分类号:F240 文献标志码:A 文
期刊
摘 要:从1996年的亚特兰大奥运会开始,都市类报纸就逐渐渗透到奥运赛事报道中,悉尼奥运会时就有诸多地方性都市类报纸派出各自得力干将亲临赛场采访报道,雅典、北京和伦敦更是达到了峰值,但采访条件的限制、整合编辑能力的欠缺、信息的同质化、网络和电视媒体的冲击、时差等因素总是困扰着诸多的都市类报纸。云南的生活新报通过构建媒体联盟、强化本土、做足深度、强化与读者互动等扬长避短,受到同行肯定。在此对其模式进
期刊
心音分类可用于检出异常心音、发现心血管病患者,在心血管病诊断方面能发挥重要作用,是基于心音信号的心血管病自动诊断领域的主要研究热点,吸引了众多国内外学者的研究兴趣。传统上基于经验选择心音信号特征以执行分类任务的方法,存在有效特征获取难、分类效果欠佳等不足。随着人工智能技术的发展,近年来深度学习已成为研究心音分类的主流方法,在分类性能上取得了较大提升。基于深度学习的心音分类网络一般都基于较大的神经网络所建立,需要大量训练样本来优化其权值。但是,现实中采集大量的心音数据是困难且昂贵的,从而导致难以获取充足的心
摘 要:实现世界旅游强国的战略构想为当前的旅游高等教育人才培养提出了新的挑战。旅游专业本科教育需要构建和优化精品人才的“培养链”。建立系统的精品人才培养体系涉及目标体系、内容体系、运行体系和评价体系等,其全过程必须贯彻和体现“精品”生产的意识和理念。  关键词:旅游本科;精品教育;培养模式;人才  中图分类号:F240 文献标志码:A 文章编号:1673-291X(2014)12-0239-03 
期刊
近年来,机器学习理论和应用正以惊人的速度发展并改善着人们的生活,目前机器学习算法已经广泛应用于民生、医疗、安防以及国防等领域,例如基于人脸识别的门禁和安防系统、基于指纹识别的支付系统、图像检索以及谷歌在研的无人驾驶汽车等等。随着计算机硬件、网络以及相关数据采集设备的快速发展,给人们获取丰富的数据资源带来了极大的便利,大量的数据含有丰富的信息,原则上应有助于机器学习学习到更合理的模型,但是丰富的数据也带来了数据复杂性的提高、信息过量和数据冗余等问题,甚至部分数据由于不规范的采集方式或恶劣的采集环境会出现大量
复杂网络作为复杂系统的一种图论模型,由众多节点及其间的连接关系构成,当节点与连接关系随时间发展变化时,就形成了复杂动态网络。从大系统的角度看,复杂动态网络是由节点群和连接关系群两个子系统耦合而成。在控制理论研究领域中,复杂动态网络作为一类重要的控制对象,囊括了诸如生物(人工)神经网络、移动通信网络、社会网络等许多现实网络,因而探索其结构特点、控制其群体行为等研究具有重要的实践和科学意义。
  在现有复杂网络研究领域中,实数加权复杂网络是一类重要的研究对象,它利用实数加权值的连线描述网络中节点间的连接
慢性肾小球疾病是导致终末期肾病的首要原因,而膜性肾病是慢性肾小球疾病的一个重要类型,在早期对膜性肾病进行精准诊断具有重要意义。临床上最为常用的诊断方法为免疫荧光法,但是此方法存在一定的假阳性概率且消耗较多人力成本,缺乏更为高效、准确的膜性肾病自动分类方法。高光谱成像技术通过获取光的发射、吸收与散射情况从而捕获可表征物质化学成分的光谱信息,实现了物理结构信息与生物化学成分信息的结合。深度学习(Deep Learning,DL)算法在图像处理领域具有明显优势,与传统算法相比深度算法可自适应地提取高阶特征,从而
糖尿病性视网膜病(DR)是糖尿病的并发症,是许多糖尿病患者失明的最终原因。它是一种广泛传播的眼病,影响着整个世界。在大规模糖尿病人群中对DR进行早期诊断,对于控制DR患病率、避免严重视力丧失起着至关重要的作用。当前,医学图像分析被用于执行DR的诊断。在计算机辅助诊断(CAD)系统进行DR早期筛查时,数字眼底成像(DFI)是已知的医学成像方式之一。为了在2015年至2020年间开发用于诊断DR的CAD系统,许多作者采用了基于深度学习(DL)的多层体系结构来获得高精度。深度学习方法对DR识别的有效性相比传统方
胰腺作为一个位于腹部深处的不显眼的小器官,主要负责人体复杂的内分泌和外分泌系统,其生理作用和病理变化与生命息息相关。然而,胰腺却非常容易受到各种病变的侵害,特别是胰腺癌。根据临床诊断,胰腺癌的发病率呈现不断上升的趋势,且其发病率几乎等于致死率。在临床上,计算机断层扫描图像(Computed Tomography,CT)对胰腺癌的确诊和判断能否进行手术切除发挥着非常重要的作用。因此,随着医学图像数量的不断增加和医学图像分析技术的不断进步,如何快速且准确地对胰腺定位和分析俨然已经成为了计算机辅助诊断(Comp