一种基于访存位置的多核DSP分簇算法
本文提出了一种基于访存位置对指令进行分簇的算法,可以显著提高FFT 等计算密集型程序的性能.通过分析基本块中每一条load 或store 指令中访问内存的基址和偏移量,能够获得任意两条访存指令之间的关系.然后经过数据流分析,对基本块分别进行一次正向扫描和逆向扫描,将基本块中的每一条指令的操作数绑定到一个运算簇上.实验结果显示,本文中的算法相比已有的传统分簇算法可以获得13.57 倍的性能提升.
数字信号处理器 分簇算法 访存地址分析 编译技术 指令级并行
XU Dong-Peng 徐东鹏 ZHENG Qi-Long 郑启龙
Anhui High Performance Computing key laboratory at Hefei, USTC, Hefei 230027, China 安徽省高性能计算重点实验室,安徽合肥,230027 School of Computer Science and Technology, USTC, Hefei 230027, China 中国科学技术大学 计算机科学与技术学院,安徽合肥 230027
国内会议
张家界
中文
1-4
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)