STREAM在多线程FT1000微处理器上的性能优化

STREAM是微处理器上内存性能的基准测试程序,在多核多线FT1000微处理器上发挥高性能是具有挑战性的研究工作.基于多级Cache结构,优化STREAM四个程序的指令流水线,根据寄存器数,设计了多级循环展开方法,根据指令延迟和Cache行的大小确定数据预取的数目,使用汇编语言编写了优化子程序.基于OpenMP并行环境,设计了STREAM并行程序,优化了局部化数据分配方式.数据测试结果表明,优化后的STREAM的性能,对比原始串行程序性能提高了19.2-64.2%.优化后,并行程序的最高访存性能达到8.5GB/s,对比优化前的最高访存性能最大提高了22.7%.
多线程微处理器 测试程序 性能优化
Chi Lihua 迟利华 Liu Jie 刘杰 Yan Yihui 晏益慧 Gan Xinbiao 甘新标 Xu Han 徐涵 Hu Qingfeng 胡庆丰
National Key Laboratory of High Performance Computation,School of Computer Science,National Universi 高性能计算国家重点实验室,国防科学技术大学计算机学院,湖南长沙,410073
国内会议
张家界
中文
1-7
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)