论文部分内容阅读
在高性能处理器中实现乘后加运算指令,将能减少运算的计算延时和算法的迭代次数,提高处理器的计算性能。设计了一种6级全流水SIMD浮点乘加单元(FMAC),设计实现了九条浮点指令,支持双精度/SIMD单精度浮点乘法、双精度/SIMD单精度浮点乘累加(减)和单精度复数乘法与点积等操作.分析各种浮点操作的实现算法,通过调整流水线结构,来降低关键路径延时,提高FMAC频率.分析了时序优化前流水线第二、三站的结构,并对优化后的二、三站代码结构和性能进行了详细的分析。最后,对FMAC进行了功能验证,在40nm工艺下采用Candence公司的RTL Compiler工具进行综合,最大延时470ps.