并行程序的指令级并行优化探讨
尽管高性能计算机性能提升越来越快,但由于其体系结构的复杂性和微处理器的复杂性,并行应用程序普遍存在性能问题,许多实际应用的持续性能通常只能达到机器峰值性能的5~10%,因而并行应用性能优化一直是高性能计算领域关注的焦点之一。本文主要从如何提高并行程序的单任务执行效率角度进行并行程序优化的探讨,以基于JASMIN 框架实现的Euler 为例,探讨并行程序在Xeon 微处理器平台上的具体性能问题和指令级性能优化方法,并完成了Euler 程序的优化。优化后程序中的核心模块gas1dapproxy 执行时间缩短了一半以上,总运行时间减少了21~34%。性能优化实验表明:流水线效率已成为影响科学计算类实际应用程序计算效率的重要因素,需要通过降低计算语句的依赖度、减少长延迟计算数量等方法予以改进。
并行程序 计算效率 性能优化
LUO Hong-Bing 罗红兵 ZHANG Xiao-Xia 张晓霞 WANG Wei 王伟 WU Lin-Ping 武林平
High performance computing center,Institute of applied physics and computional mathematics,Beijing 1 北京应用物理与计算数学研究所 高性能计算中心,北京 100094
国内会议
张家界
中文
1-8
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)