一个结构网格并行CFD程序的单机性能优化
从单机性能优化角度对一个高阶精度结构网格CFD并行程序进行了优化.通过识别关键变量并对其进行常量参数化优化,使编译器能够实现更高级别的针对性优化;根据程序数据结构特点及访问模式,设计了分级数据缓存技术,使程序主要计算代码能够以更优的方式访问主要数据结构,提高访存空间局部性;进行了各种循环变换以优化访存性能.在国家超算长沙中心“Tianhe-1A”并行机上的测试结果表明,相对于采用Intel编译器最高优化级别的版本,对100万网格点二维翼型算例,串行程序性能提高约22.2%~28.9%,对1.12亿网格点三角翼算例,并行程序性能提高约13.9%~20.2%.
计算流体动力学 并行计算 性能优化 变量参数化 分级数据 缓存技术
CHE Yong-Gang 车永刚 ZHANG Li-Lun 张理论 WANG Yong-Xian 王勇献 XU Chuan-Fu 徐传福 Liu Wei 刘巍 Wang Zheng-Hua 王正华 Liu Hua-Yong 刘化勇
School of Computer, National University of Defense Technology, Changsha 410073 国防科技大学计算机学院,长沙 410073 State Key Laboratory of Aerodynamics, Mianyang 621000 空气动力学国家重点实验室,绵阳 621000
国内会议
张家界
中文
1-8
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)