面向多核向量处理器的基4FFT向量化设计与实现
本文提出一种将基4FFT算法映射到Matrix多核向量处理器的向量化方法.针对Matrix体系结构的特点,将FFT算法的混洗需求和访存请求融合,减少了混洗模式;并通过软件流水的方法充分挖掘了Matrix的指令级和数据级并行性,从而有效地提高了FFT的计算性能.实验结果表明,提出的双精度浮点基4FFT向量化方法取得较高的性能,相比TIC6713、4096点的基4FFT平均加速比为92.6.
向量处理器 结构设计 快速傅里叶变换 计算性能
向宏卫 吴家铸 刘仲
国防科技大学计算机学院 长沙410073
国内会议
西宁
中文
130-134
2013-07-20(万方平台首次上网日期,不代表论文的发表时间)