GPU集群上的三维UPML-FDTD算法的实现及优化
在高性能计算领域,拥有强大浮点计算性能的协处理器正在快速的发展.近年来,利用协处理器如GPU来加速时域有限差分(FDTD)算法的计算过程成为电磁研究领域的热点问题.本文在GPU集群上实现了三维UPML—FDTD算法并进行了优化.本算法采用电偶极子激励源对算法的模拟结果同解析解进行了验证,结果表明算法具有较高的精度,同时在Tesla M2070和K20m GPU集群上对FDTD算法的性能进行测试,对优化前后的计算结果以及GPU与CPU的计算性能进行了比较,并使用80块Tesla K20m GPU进行了可扩展性测试.从本文的研究结果可以看出,经过优化的FDTD算法性能有了较大的提升,而且FDTD算法在GPU集群上获得了比较理想的并行效率.
图形处理器 三维加速时域有限差分算法 数值模拟 可扩展性 精度分析
徐磊 徐莹 蒋荣琳 张丹丹
上海超级计算中心,上海201203
国内会议
桂林
中文
155-164
2013-10-29(万方平台首次上网日期,不代表论文的发表时间)