论文部分内容阅读
核方法是机器学习领域的经典模型之一,其原理是将输入的原始空间的特征映射到高维甚至无穷维空间中,并在高维空间学习得到对应的线性模型,使模型具有极强的非线性表达能力。核方法在回归、分类等任务上都有广泛的应用。作为理论较为完备的机器学习算法,其在不同场景下仍有许多亟待解决的问题:(1)在多输出回归应用中,核方法极大提升了模型的非线性表达能力,但同时导致模型的灵活性受限,尤其在处理多个输出相关性问题上,显得能力不足;(2)通常基于核方法的判别模型处理样本个体为单个样例,当处理单个样本为一个集合数据的学习任务时,现有的核方法未能很好解决;(3)在元学习思路下的小样本学习任务中,选择基于核方法的判别模型作为基础学习器,如何构建数据驱动的自适应核以有效提升小样本学习的性能,是一个值得研究的问题。针对上述挑战性问题,本文以核方法为基础,研究在多输出回归、集合匹配以及元学习框架下基于核的相关算法,并分别提出三种模型,在一定程度上解决了核方法在不同学习场景下的有效使用问题。其中,在研究元学习范式下核方法的相关算法时,使用变分推断的方式获得核函数的谱分布。由此本文对推断问题进行拓展,研究基于流结构的推断生成模型,并结合图像生成任务,解决了基于流结构的有条件生成问题。本文的具体工作包括如下四方面。
1.核化的结构化支持向量回归模型:为了显式描述核化的多输出回归模型输出的相关性,提升模型的判别性能,本文提出一种简洁有效的两层模型,命名为结构化支持向量回归模型。其中,模型的第一层是非线性映射层,该层主要依赖核函数中包含的隐式复杂非线性映射函数,从而使得模型能够较好的处理输入和输出之间复杂非线性关系。模型的第二层是显式的相关性学习层,基于组稀疏的线性结构,能充分考虑多个输出的相关性以及多个输出之间存在的结构化信息,极大增强了模型的表达能力。同时,方法在模型训练过程引入流形平滑项以提升模型的鲁棒性。本文提出交替迭代优化算法来求解该目标函数,并对其收敛性进行分析。在多个公开的多输出回归数据集以及实际应用场景下的医学指标回归任务上的实验结果,验证了该模型的有效性。
2.基于多核学习的深度匹配核模型:为了有效解决集合匹配问题,本文提出一种新的加性深度匹配核模型来实现集合之间的直接匹配度量。该模型包含两个层次的核:局部核和全局核。本文选择基于深度神经网络的深度核作为基础的局部匹配核,利用局部匹配核以有效的度量集合内元素的相似度。通过引入锚点,算法可以利用有监督的多核学习将多个局部匹配核融合在一起,得到集合之间的全局匹配核。该模型具有计算速度快,并且不依赖于特定的分布或几何结构假设等优点。在基于视频的人脸识别,动态场景识别,以及多视角物体识别三个视觉分类任务数据集上的实验结果,验证了该模型的有效性。
3.基于自适应核的元学习模型:为了融合核估计技术和元学习思想,实现将核方法向到元学习设置下小样本学习的拓展,本文提出一种新的元学习框架。该模型研究在元学习框架下的基于随机傅里叶特征的核估计技术,实现了以数据驱动的方式,从数据中推断针对当前任务的自适应核。在模型设计阶段,创新地将求解过程转化为求解一个变分推断问题,并且导出新的变分下限(ELBO)。同时,模型通过引入基于LSTM的上下文推断方式来增强其从多个任务中获取有效共享信息的能力,从而得到信息更加丰富的特征。本模型构建的自适应核函数具有表达能力强、采样率低等优点,可在测试阶段快速适应新任务进而提升模型性能,且模型的良好性能在小样本回归和小样本分类实验上得到了有效验证。
4.基于流结构的条件生成模型:相较于基于变分推断的生成模型,基于流结构的生成模型具有直接估计准确的似然函数的优势。但当前基于流结构的生成模型未能较好解决条件生成问题。针对此问题,本文提出一种新的基于流结构的生成模型来处理条件生成任务。该模型包含两个可逆神经网络和一个关联网络,并在训练过程中将输入向量和真实输出向量映射到隐含空间,分别得到两个隐含变量。该模型的优势是在给定输入向量时,输出向量的条件分布可简化为求解两个隐含变量之间的条件分布。此外,本文考虑拓展模型的功能,使其能够处理在给定另一个域的额外信息的情况下,实现对输出向量的操控。本文在脑图像的模态转换任务上的实验结果,充分验证了模型的有效性,在自然图像上的“风格转换”任务上的实验结果,初步验证了模型的通用性。
1.核化的结构化支持向量回归模型:为了显式描述核化的多输出回归模型输出的相关性,提升模型的判别性能,本文提出一种简洁有效的两层模型,命名为结构化支持向量回归模型。其中,模型的第一层是非线性映射层,该层主要依赖核函数中包含的隐式复杂非线性映射函数,从而使得模型能够较好的处理输入和输出之间复杂非线性关系。模型的第二层是显式的相关性学习层,基于组稀疏的线性结构,能充分考虑多个输出的相关性以及多个输出之间存在的结构化信息,极大增强了模型的表达能力。同时,方法在模型训练过程引入流形平滑项以提升模型的鲁棒性。本文提出交替迭代优化算法来求解该目标函数,并对其收敛性进行分析。在多个公开的多输出回归数据集以及实际应用场景下的医学指标回归任务上的实验结果,验证了该模型的有效性。
2.基于多核学习的深度匹配核模型:为了有效解决集合匹配问题,本文提出一种新的加性深度匹配核模型来实现集合之间的直接匹配度量。该模型包含两个层次的核:局部核和全局核。本文选择基于深度神经网络的深度核作为基础的局部匹配核,利用局部匹配核以有效的度量集合内元素的相似度。通过引入锚点,算法可以利用有监督的多核学习将多个局部匹配核融合在一起,得到集合之间的全局匹配核。该模型具有计算速度快,并且不依赖于特定的分布或几何结构假设等优点。在基于视频的人脸识别,动态场景识别,以及多视角物体识别三个视觉分类任务数据集上的实验结果,验证了该模型的有效性。
3.基于自适应核的元学习模型:为了融合核估计技术和元学习思想,实现将核方法向到元学习设置下小样本学习的拓展,本文提出一种新的元学习框架。该模型研究在元学习框架下的基于随机傅里叶特征的核估计技术,实现了以数据驱动的方式,从数据中推断针对当前任务的自适应核。在模型设计阶段,创新地将求解过程转化为求解一个变分推断问题,并且导出新的变分下限(ELBO)。同时,模型通过引入基于LSTM的上下文推断方式来增强其从多个任务中获取有效共享信息的能力,从而得到信息更加丰富的特征。本模型构建的自适应核函数具有表达能力强、采样率低等优点,可在测试阶段快速适应新任务进而提升模型性能,且模型的良好性能在小样本回归和小样本分类实验上得到了有效验证。
4.基于流结构的条件生成模型:相较于基于变分推断的生成模型,基于流结构的生成模型具有直接估计准确的似然函数的优势。但当前基于流结构的生成模型未能较好解决条件生成问题。针对此问题,本文提出一种新的基于流结构的生成模型来处理条件生成任务。该模型包含两个可逆神经网络和一个关联网络,并在训练过程中将输入向量和真实输出向量映射到隐含空间,分别得到两个隐含变量。该模型的优势是在给定输入向量时,输出向量的条件分布可简化为求解两个隐含变量之间的条件分布。此外,本文考虑拓展模型的功能,使其能够处理在给定另一个域的额外信息的情况下,实现对输出向量的操控。本文在脑图像的模态转换任务上的实验结果,充分验证了模型的有效性,在自然图像上的“风格转换”任务上的实验结果,初步验证了模型的通用性。