会议专题

线性系统求解中迭代算法的GPU加速方法

在求解线性系统时,迭代法是一种基本的方法,特别是在系数矩阵为大规模稀疏矩阵的情况下,高效地使用迭代法求解变得十分重要。本文通过分析迭代法的一般特点,提出了使用具有强大计算能力和存储带宽的GPU加速迭代法的一般方法。利用这些方法,在两种主流GPU平台上实现了一个经典的迭代法PQMRCGSTAB,并且针对不同的GPU平台特点提出了具体的优化方法。与AMD Opteron 2.4GHz4核处理器相比,双精度版本的PQMRCGSTAB算法经NVIDIA Tesla S1070加速后性能提高31倍,经AMD Radeon HD4870 X2加速后性能提高9倍。

图形处理器 迭代算法 GPU加速 PQMRCGSTAB算法 计算能力 存储带宽

葛振 杨灿群 吴强 陈娟

国防科技大学计算机学院,湖南 长沙 410073

国内会议

2009年全国高性能计算学术年会

长沙

中文

179-182

2009-10-23(万方平台首次上网日期,不代表论文的发表时间)