典型矩阵分解的FPGA计算方法研究

被引量 : 0次 | 上传用户:yuanjinxing1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间平台的剩余使用寿命(RUL, Remaining Useful Life)预测算法受飞行器空间、体积、重量等因素制约需要低功耗、嵌入式计算平台。目前,基于FPGA(Field-Programmable Gate Array)的硬件加速计算以其体系结构的灵活性和定制计算的高效性成为特定算法在资源受限情况下一种良好的解决方案。矩阵分解作为数值运算领域一个重要的分支,是RUL预测算法中特征提取、最小二乘求解等问题的核心和关键。故开展矩阵分解的FPGA计算方法研究对于在嵌入式平台下空间飞行器RUL快速、实时预测有一定理论价值和实际意义,可以为测试信息处理相关算法的FPGA平台移植提供有效的技术途径。因此,本文针对特定研究背景,选取科学计算领域较为典型的QR分解、LU分解和改进Cholesky分解,开展矩阵分解FPGA实现方法的相关研究工作。首先,开展典型矩阵分解架构的设计方法研究,针对大规模矩阵分解与矩阵分解设计模式的实际需求,采用层次化存储策略和改进的通信总线协议设计,实现基于Xilinx FPGA的矩阵分解架构设计。然后,以矩阵QR分解实现为例,研究定制计算及软硬件协同设计两种矩阵分解算法设计模式。提出一种以计算密集型代码为依据的系统任务划分方法,解决了矩阵分解计算设计模式的关键问题。采用合理的并行运算单元设计和有效的片内外存储单元复用,平衡系统资源与计算效率之间的关系。最后,针对线性最小二乘问题的求解,结合典型矩阵分解架构及速度性能更优的定制计算模式,研究了大规模矩阵改进Cholesky分解和LU分解。同时,针对不同特点的方程组系数矩阵分解性能评价,实现了不同类型最小二乘问题求解中矩阵分解算法的选取。实验和测试结果表明,本文提出的矩阵分解FPGA计算方法,在外部存储资源制约的前提下,能够满足最大规模10000维矩阵分解的实际需求,并且相对PC平台,在同等分解规模条件下具有大幅度的效率提升,为基于FPGA的科学计算研究提供了良好的核心计算方法实现手段,并具备良好的应用价值。
其他文献
介绍了渐开线直齿内齿轮插齿刀主要参数的优化设计方法,论述了该方法的数学建模及优化方法选择,并通过设计实例验证了该方法对设计参数的优化效果.
目的:观察血尿康颗粒对IgA肾病小鼠的药理作用。方法:采用“口服牛斑清白蛋白联合尾静脉注射葡萄球菌肠毒素 B法”复制小鼠IgA肾病模型,随机分为模型组、雷公藤多苷组、血尿康颗
本课题以气雾化T15高速钢粉末为研究对象,系统地研究了快速凝固过程中,高速钢粉末颗粒组织和物相变化规律。利用粉末冶金方法固结成形,通过后续热处理工艺,获得了具有高强度、高
针对不同教育层次护理人才对护理案例的不同需求,并结合当前各层次护理人才培养目标,就护理案例资源库在教学培养及护理技能考核方面进行阐述,提出相关建议,以期为新世纪护理
培养学生的学习兴趣,是任何一门学科教学都要面临的重要问题。文章主要从历史教学法的革新入手,认为要实现历史教学的目标,教师就要激发学生的学习兴趣,引起师生情感的共鸣,
人生而蕴含灵性的潜能,随着人在社会生活中的正常成长、接受教育和自觉努力,灵性的潜能就会在不同人的心里不同程度地发育、生长。人性灵指人拥有丰富、微妙、敏感的精神状态
随着经济全球化的发展,国际贸易日益频繁。当中国品牌进军海外市场时,选择恰当的英文品牌名称对中国企业来说至关重要。尤其是作为中国商业品牌代表的中华老字号,在走出国门、进
20世纪西方高等教育经历的两次较大扩张导致了多种阐释扩张的理论,教育过度说与大众高等教育说是其中主要两种。大众高等教育学说在中国语境中受到种种误读,并因此影响到中国
制造业是我国西部地区的支柱产业,在整个经济系统中占据着不容忽视的重要地位。伴随西部大开发战略的深入贯彻,西部地区的投资热潮仍旧集中在制造业行业,不同类型的外资(以下简称
振动是直升机的固有特性,在直升机正常工作时,常常会产生由于多阶振型同时被激发出来而引起的宽带随机振动现象,这对直升机上敏感设备的危害是非常大的,特别是容易造成设备的失灵