单节点多GPU集群下HPL动态负载均衡优化
现有GPU加速的高性能Linpack 基准测试程序(HPL)一般采用基于实际运算能力的动态负载均衡算法来实现.然而该算法在单节点多GPU的平台上表现不佳,其原因是单节点多GPU平台上单个GPU计算量小,并且GPU与CPU 的总性能差距较大.为此,本文提出了经验指导的动态负载均衡算法以及多GPU 自适应负载均衡算法,并且在单节点多GPU 平台上进行验证,对比现有基于NVIDIA 费米GPU 的HPL 有6.3%的加速效果.
图形处理器 高性能Linpack基准测试程序 动态负载 均衡算法
CHEN Ren-Zhi 陈任之 Huang Li-Bo 黄立波 Chen Xu-Hao 陈顼颢 Wang Zhi-Ying 王志英
School of Computer National University of Defense technology, Changsha 410073, China 国防科学技术大学 计算机学院,长沙 410073
国内会议
张家界
中文
1-8
2012-10-29(万方平台首次上网日期,不代表论文的发表时间)