代数多重网格在GPU上的优化研究
近年来,随着GPU更多地用于科学计算,在高性能计算领域起着越来越重要的作用。NVIDIA第三代Fermi架构的开发,大大提升了GPU的双精度浮点运算能力。代数多重网格(AMG)作为高性能计算领域中的重要迭代算法,利用GPU的高浮点计算能力对其优化是很有必要的。本文基于求解稀疏代数方程组对AMG算法进行GPU优化,AMG-GPU的性能提升为原始AMG的2倍。但在1e-6的精度要求下,由于迭代次数的减少AMG-GPU的性能仅提升约6%。我们对AMG-GPU进行了详细剖析,得出AMG各层操作算子规模的动态变化是影响AMG性能提升的关键因素。
高性能计算 代数多重网格 双精度浮点运算能力 迭代算法 图形处理单元
李佳佳 张秀霞 谭光明 陈明宇
中国科学院计算技术研究所,北京100190
国内会议
2011年全国高性能计算学术年会(HPC china2011)
济南
中文
1-7
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)