无监督流行学习算法的若干探讨

来源 :浙江大学 | 被引量 : 0次 | 上传用户:jian85733547
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息处理领域中,通常将信息表示为高维空间中的向量,然后再进行后续的数据处理.然而在实际运用中,往往由于高维数据的维数太大而无法保证数据处理方法的健壮和效率.数据降维是解决上述问题的一种有效途径.在过去十年间,已经发展出一大批非线性降维技术.这些技术包括等距映射方法(ISOMAP),局部线性嵌入方法(LLE),黑赛局部线性嵌入方法(HLLE),拉普拉斯特征映射方法(LE)和局部切空间排列方法(LTSA)等.这些算法基于样本数据分布在低维流形上的假设,在缺乏先验知识的情况下提取流形的特征,并获得其低维表示.   本文首先介绍数据降维的背景问题,问题的数学描述以及研究现状,介绍基于流形假设的PCA,LLE,LE和LTSA等算法.同时针对流形学习算法共同面临的困难:如何确定邻域规模;阐述一种选取邻域的统一框架-权重邻域.在本文中,我们综合上述算法的特点,提出一种无监督流形学习算法:加权局部切空间排列(WLTSA).我们给出WLTSA的算法思路和实现细节,并指出它能够避免确定邻域规模的困难的特点.最后我们展示算法应用在各种数据集上的效果.  
其他文献
本文利用比较原理与位势井理论相结合的方法针对一类非线性抛物方程的高能适定性问题及一类锥空间上强耗散抛物方程的初边值问题适定性行了全面的研究,力图揭示泛函空间结构
摘 要:本文主要阐述了在汉语教学中听力教学的意义和必要性,影响听力教学的主要因素,并提出加强汉语听力教学,提高民族学生汉语听力能力应采取的措施。  关键词:汉语教学 听力教学 文化差异 母语  在汉语教学中,学生听、说、读、写四个技能的提高,听力居于首位,可见其在汉语学习中的重要性。众所周知,我们获得信息的方法是多种多样的,而主要的是借助于视觉于听觉。也就是说,在人们的交际活动中,听是吸收信息的主
线性模型是一类研究历史悠久、应用范围广泛的统计模型,在生物,医学,经济以及社会科学等方面都有着广泛的应用。在模型的统计分析中,结果解释是重要的组成部分。   本文从线性
心理学研究发现,在一定的条件下,具有明显社会意义的知识,对学生的学习兴趣有着特殊的影响。和班上学生在课堂上首次见面时,教师应让学生了解学习英语的目的,知道学习英语对社会主义建设和自身将来发展的重要意义。  英语是国际上目前公认的通用语言,任何国家想发展工业,科技,在国际市场上与其他国家抗衡,都不可缺少英语。在科技、军事、经济等各方面,我国与西方发达国家都还存在着不小的差距。要国富民强,要赶超世界发
期刊
本文主要研究了以下两类具有阻尼的波动方程的整体适定性问题(此处公式省略)  其中Ω∈?2为边界δΩ光滑的有界区域.  本文的第一部分研究了一类具强阻尼的波动方程(1)的初
图像分割是按照一定的标准把图像分成各具特性的区域并提取出感兴趣目标的技术和过程,它是对图像进行进一步分析、理解和识别的基础,是图像可视化、图像测量、图像压缩等许多
从噪声背景下提取多正弦信号的参数估计是信号处理与通信系统等领域当中的一个重要问题。目前,多正弦信号的参数估计已经应用于各个领域中,如控制理论、雷达应用、生物医学工