论文部分内容阅读
空间平台的剩余使用寿命(RUL, Remaining Useful Life)预测算法受飞行器空间、体积、重量等因素制约需要低功耗、嵌入式计算平台。目前,基于FPGA(Field-Programmable Gate Array)的硬件加速计算以其体系结构的灵活性和定制计算的高效性成为特定算法在资源受限情况下一种良好的解决方案。矩阵分解作为数值运算领域一个重要的分支,是RUL预测算法中特征提取、最小二乘求解等问题的核心和关键。故开展矩阵分解的FPGA计算方法研究对于在嵌入式平台下空间飞行器RUL快速、实时预测有一定理论价值和实际意义,可以为测试信息处理相关算法的FPGA平台移植提供有效的技术途径。因此,本文针对特定研究背景,选取科学计算领域较为典型的QR分解、LU分解和改进Cholesky分解,开展矩阵分解FPGA实现方法的相关研究工作。首先,开展典型矩阵分解架构的设计方法研究,针对大规模矩阵分解与矩阵分解设计模式的实际需求,采用层次化存储策略和改进的通信总线协议设计,实现基于Xilinx FPGA的矩阵分解架构设计。然后,以矩阵QR分解实现为例,研究定制计算及软硬件协同设计两种矩阵分解算法设计模式。提出一种以计算密集型代码为依据的系统任务划分方法,解决了矩阵分解计算设计模式的关键问题。采用合理的并行运算单元设计和有效的片内外存储单元复用,平衡系统资源与计算效率之间的关系。最后,针对线性最小二乘问题的求解,结合典型矩阵分解架构及速度性能更优的定制计算模式,研究了大规模矩阵改进Cholesky分解和LU分解。同时,针对不同特点的方程组系数矩阵分解性能评价,实现了不同类型最小二乘问题求解中矩阵分解算法的选取。实验和测试结果表明,本文提出的矩阵分解FPGA计算方法,在外部存储资源制约的前提下,能够满足最大规模10000维矩阵分解的实际需求,并且相对PC平台,在同等分解规模条件下具有大幅度的效率提升,为基于FPGA的科学计算研究提供了良好的核心计算方法实现手段,并具备良好的应用价值。