【摘 要】
:
随着机器学习的不断发展,流形学习逐渐成为一个研究热点。流形学习是针对一个数据集进行的机器学习,这个数据集中的每一个数据点可以有多个属性值,即可以把每一个数据点看做是一个向量。已有的研究表明,数据集中的数据可以认为是欧氏空间中的点,而对于高维空间的研究,具有一定的理论难度和计算复杂度,因此需要在对数据进行分析前,将高维数据的维数降低。已有的大部分研究方法均将高维数据矩阵化,对矩阵进行相应的如奇异值分
论文部分内容阅读
随着机器学习的不断发展,流形学习逐渐成为一个研究热点。流形学习是针对一个数据集进行的机器学习,这个数据集中的每一个数据点可以有多个属性值,即可以把每一个数据点看做是一个向量。已有的研究表明,数据集中的数据可以认为是欧氏空间中的点,而对于高维空间的研究,具有一定的理论难度和计算复杂度,因此需要在对数据进行分析前,将高维数据的维数降低。已有的大部分研究方法均将高维数据矩阵化,对矩阵进行相应的如奇异值分解等操作。随后利用常用的降维及分类算法如主成分分析(PCA),线性判别分析(LDA)对其进行特征提取及分类。但由于数据维度高,规模大,对原始数据的矩阵化往往导致计算复杂度大幅提高,影响了算法的执行效率。另外,对原始数据的矩阵化破坏了原始数据的内部结构,损失了大量数据信息。近年来,将高维数据看做张量的研究逐渐增多,张量型数据可以很好地保持原始数据中的结构信息,并且不需要直接对原始数据矩阵化之后的高维矩阵进行操作,这大大减少了计算量,降低了算法复杂度,提高了算法的执行效率。经典的基于张量的算法有多线性主成分分析(MPCA),多线性判别分析(MDA),广义张量判别分析(GTDA)等。受到向量型算法中将PCA与LDA结合进行数据的特征提取及分类的思想的启发,本文利用张量分析的方法,将这两种算法对应的多线性版本进行结合,考虑到MDA算法不具有较好的收敛性,因此本文研究了融合MPCA与GTDA的特征提取与分类方法。该方法首先使张量数据的各模式展开矩阵的方差最大化,以达到利用MPCA进行特征提取的目的,其后再使各模式展开矩阵的总离散度最大化,以达到GTDA进行分类的目的。文中首先研究了该方法的算法原理及流程,其后分析了算法的初始条件,终止条件以及收敛性。
其他文献
采用不同浓度的壳聚糖对金冠苹果进行涂膜试验,观察缩果皱皮情况,并测定了不同浓度涂膜液对金冠苹果的失重率、硬度、总酸、总糖、呼吸强度及Vc含量等生理生化指标的影响。结
<正>随着外科学和医疗技术的飞速发展,许多高新、精密设备和新技术在外科手术中广泛应用,对手术室新护士的专业素质和技术要求越来越高。新护士要培养成一名优秀的手术室专科
为了提高沈阳在国内乃至国际旅游市场上的竞争力,同时利用现有的丰厚的旅游资源为沈阳带来新的经济增长点,沈阳应该充分重视其旅游目的地形象建设,以旅游业的蓬勃发展促进沈阳产
《中国诗词大会》热播后,人们蓦然回首,发现诗词就在身边,从未远去。诗词不是别的,就是我们的人生。“小娃撑小艇,偷采白莲回”的顽皮,“儿童散学归来早,忙趁东风放纸鸢”的童趣,“难
设计一套以8031单片机为核心的微机控制给水系统,并介绍其组成、软件设计、抗干扰措施等,实践表明该系统具有节能、维护方便的特点。
微流控芯片(Microfluidic Chip)作为微型全分析系统的核心,具有高效分离、快速分析、低试剂消耗、设备微型化、单元集成化等特点,为食品安全分析提供了一种崭新的技术工具和平
运用“共有系统”论来重新审视中华文化圈内部各种文化之间的翻译史,目的是为了重写翻译史。中华文化圈中的汉文化,以礼义为标志的“华夷之辨”文化传统,“以文化为纽带、以利益
氧化应激(oxidative stress,OS)是缺血性脑血管疾病重要病理反应过程。缺血性脑损伤后,活性氧自由基(oxygen free radical,OFR)增加,通过坏死或凋亡的方式引起细胞死亡,还介导线粒体途
本研究首先深入分析了加拿大综合学习指数、欧洲终身学习指数、德国学习图谱、TELS学习型城市审计工具及联合国教科文组织提出的学习型城市主要特征,发现当前学习型城市的职
感染是呼吸系统慢性疾病发生及急性加重的常见原因,如慢性阻塞性肺疾病(慢阻肺)和支气管哮喘[1]。目前普遍认为巨噬细胞作为重要的效应细胞之一,在慢阻肺气道炎症启动中起决