基于云计算平台的大规模流形学习算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:keke127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展,给人们带来了大量的信息,但也增加了人们从这些数据中获取所需知识的难度。为了解决这一问题,数据挖掘技术得到了快速的发展,目前数据挖掘技术已被广泛应用于金融、医疗、互联网络、政治经济和社会生活等领域。随着数据规模指数级的增长,如何在超大规模的数据中进行有效的挖掘?为了迎接这一挑战,人们越来越倾向于使用云计算平台来进行超大规模的数据挖掘,如Google、Hadoop等云计算平台。Google提出的Map reduce编程模型就是针对海量数据的处理。编程人员只需集中注意力在所需解决的并行计算任务上,而不需要考虑数据的分割、任务的分配、容错等细节问题,极大的提高了编程的效率。本文提出了根据L2范数的位置敏感哈希方法来查找数据点的近似k-近邻,并在此基础上实现了基于局部线性嵌入的特征提取和基于拉普拉斯特征变换的特征提取算法。在特征提取算法中相似矩阵使用L2范数的位置敏感哈希计算近似k-近邻,采用分布式Lanzcos计算拉普拉斯矩阵的特征向量,通过不同的并行策略,使得算法的性能在整体上获得提高。通过实验,分析算法在Map reduce框架上的性能和效果。
其他文献
随着叉车工业技术的快速发展及其在物流系统的广泛应用,叉车操纵稳定性问题日益受到人们的关注。四轮转向是一种有效提高车辆行驶安全和操纵稳定性的主动控制技术,能够减小车辆的转弯半径,使其转向更加灵活。装配线控转向系统的车辆通过电信号传递转向控制信息,不仅节能环保,而且提高了车辆设计的灵活性,同时也使得跟踪车辆转向的期望状态成为可能。本文以四轮线控转向叉车为研究对象,并结合预瞄最优曲率驾驶员模型,对四轮转
本文将足球视频视为研究对象,对足球视频中典型事件检测技术进行分析和研究。从足球视频的特点出发,结合足球比赛的领域知识,引入线索作为基于内容的检测技术中底层特征与高
随着控制理论的发展和实际工业过程的需要,对存在大量不确定因素的动态复杂系统的控制成为当今控制界研究的热点之一。这些不确定的因素包括:系统参数变化较大、系统故障、较
三维视景仿真是虚拟现实领域的主要研究课题,它能为利用计算机技术为人们建立一个逼真度和可信度都较高的虚拟场景,在当前的很多领域中都有了广泛的应用,包括交互式的游戏娱乐、
介电材料电传导能力很低,同时具备较好的电介质强度性质,是广泛应用于电线、电缆、电动机等的绝缘材料。电缆的绝缘层在温度、化学腐蚀、机械应力等因素的长期作用下,容易发
执行器是工业自动控制系统中的一个重要环节,能够对控制性能产生直接的影响。由于经常工作在高温、高压等恶劣的环境中,执行器比较容易出现故障,因此提高执行器本身的可靠性
无线视频传感器网络是由一组具有计算、存储以及通讯能力的视频传感器节点所组成的分布式感知网络。相对于传统WSN,无线视频传感器网络视频信息量更大,硬件资源有限的特点更加
随着全球石油资源短缺和气候环境污染问题的日益严重,开发油耗小、排放低的新能源汽车将是汽车工业发展的主题。混合动力汽车形式灵活、可实施性强,在现阶段能够较好地缓解能
随着人类基因组计划的相继完成及各种模式生物基因组计划的相继实施,使有关生物数据急剧增加。面对海量的生物数据,如何对其进行科学地分析,处理,进而获取对人类有用的信息,是科学
随着科学技术的发展,机器人技术不断提高,机器人应用领域不断扩张,陆地机器人已经无法满足人类对探索环境和改善生活的需求,上天下地入海三方面都急需机器人进入角色,世界许