并行linpack分析与优化探讨
HPL是大规模集群系统广泛采用的linpack测试软件包,本文在深入分析线性代数方程组分块并行求解算法和HPL实现技巧的基础上,探讨了HPL峰值性能的制约因素.重点讨论了LU分解过程中主要参数P×Q和NB对计算性能的影响.理论分析与实验结果表明,定义为矩阵运算时间与其运算量之比的效率因子很大程度上相关于矩阵的分块大小,而与矩阵规模本身关系微乎其微.根据这一规律,本文作者提出通过扫描小规模矩阵运算效率来确定大规模并行测试中分块大小NB,改善长期以来只是通过反复实验试探获取NB的现状,大大缩短了NB的确定过程,为其最终定位提供了相对精确的理论化依据.目前实际测试结果基本验证了本文作者的想法,这一方法同样适用于其他过程中的矩阵并行运算.
HPL 线性代数方程组 LU分解 MPI
张文力 陈明宇 冯圣中 樊建平
中国科学院计算技术研究所,北京,100080
国内会议
中国科学院计算技术研究所第八届计算机科学与技术研究生学术讨论会
大连
中文
41-42
2004-07-01(万方平台首次上网日期,不代表论文的发表时间)