分布式张量列分解算法的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:crystal19900224
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多传感器技术和计算机科学的快速发展,现实世界中产生的数据属性繁多,多属性的数据集有利于全面分析数据各属性之间的联系。因此,使用高阶张量融合多属性数据便于挖掘多属性数据中的关联信息。然而,处理高阶张量时所需的计算机内存、计算次数等资源都会随阶数呈指数增长,导致某些算法无法在多项式时间内得出结果,这个问题称为维数灾难。张量列分解算法是一种新颖的张量分解算法,其将高阶张量分解为多个三阶张量,从而把指数级问题转化为立方级问题,可以很好的应对维数灾难的困境。但是对于大规模的张量数据,张量列分解算法迭代执行,分解效率低下,执行时间长,而且由于计算机的内存限制,甚至无法容纳一块完整的张量数据。因此,对于目前现实世界中产生的高阶多属性融合数据,实现分布式的张量列分解算法将是本文的研究重点。本文以数据分块为基本点,提出了两种分布式张量列分解算法,对张量列分解算法实现并行化处理,而且可以处理计算机内存无法容纳的大规模数据的张量列分解。最后给出了算法在信号处理中的应用实例。本文的主要研究可归纳如下:1.提出基于数据并行的分布式张量列分解算法。张量列分解算法整体上是迭代的算法,基于数据并行的分布式张量列分解算法在迭代的每一步中对张量的展开矩阵进行切块,并行地对分块矩阵做奇异值分解,然后使用归并的方式对分块矩阵结果合并得到最终结果。算法相比于现有的张量列分解算法可以节省大量时间,并保持较高的数值精度。但是基于数据并行的分布式张量列分解算法的分布式并行方案不够彻底,依然存在着较大的改进空间。2.提出基于算法并行的分布式增量式张量列分解算法。研究张量列分解算法迭代过程中展开矩阵的规律,推导出每一步展开矩阵的通项变换公式,从而将算法的执行从迭代改为并行,对每一步的展开矩阵同时分解。同时,基于张量切块的思想,由子张量处理结果合并为每一步展开矩阵的奇异值分解结果。算法相比于基于数据并行的分布式张量列分解算法在计算时效性方面有着明显提高。算法还实现了增量式的张量列分解算法,在数据增量时避免对历史数据的重复计算。3.实现了张量列分解在信号处理中的两个应用实例,分别用于物体识别和轴承故障检测,验证了张量列分解算法在特征提取方面的可行性。
其他文献
巴黎戴高乐机场候机楼空间结构倒塌是大跨空间结构破坏的一个典型例子,受到工程的普遍关注。事故调查委员会初步给出了相关调整结果,认为该结构安全度低是事故产生的直接原因
11月5日,长生生物公告称,自11月5日起,公司将被实行退市风险警示处理,股票简称将变更为“*ST长生(维权)”。此前两天,长油5(长航油运)刚宣布,公司重新上市的申请已获上交所批准。$$一家
报纸
<正> 今年四月二十三日塔斯社突然声明:“礼炮-7”任务已完成,停止工作。但也未进一步透露细情。据美国跟踪表明,“礼炮-7”并未出现滚动异常情况,运行正常,据推测可能是发生
"明者因时而变,知者随事而制",在"互联网+"背景下,重视实现政务服务与新媒体的融合,是推动政府部门与时俱进、提升政府部门政务服务成效的关键路径,为此,政府部门有必要重视
近三十年,我国经济高速增长“奇迹”的代价是环境的严重破坏,如今环境恶化已经严重制约了我国经济的发展。因此,如何协调环境保护与经济增长间的关系成为了我国当前的重要任
在全球经济快速发展的今天,运输需求的急剧扩大促进了机动车保有量的飞速增长,导致道路环境中汽车尾气含量严重超标,因此具有降解尾气功能的环保路面技术成为目前道路工程技
本报讯(记者 张骏)昨天,市政协召开十二届七十六次主席会议,审议《上海流量经济发展的现状及对策建议(草案)》。市政协主席吴志明主持。$$今年3月,市政协经济委员会与上海社科院经
报纸
介绍了一种在国外矿山磨矿自动化系统中广泛使用的应变片式磨机压力传感器,及其在磨矿过程变量、磨矿过程控制中的工作原理、设计、选择以及工艺布置,提出国内测量磨机负荷的方
文章分析了影响美国破产程序中实质合并规则的判断因素及该规则适用中各方利益主体的平衡关系,阐述了实质合并规则的基本原则、合并的前提条件等核心问题,并与公司法中的“揭破