会议专题

GPU集群上的三维UPML-FDTD算法的实现及优化

在高性能计算领域,拥有强大浮点计算性能的协处理器正在快速的发展.近年来,利用协处理器如GPU来加速时域有限差分(FDTD)算法的计算过程成为电磁研究领域的热点问题.本文在GPU集群上实现了三维UPML—FDTD算法并进行了优化.本算法采用电偶极子激励源对算法的模拟结果同解析解进行了验证,结果表明算法具有较高的精度,同时在Tesla M2070和K20m GPU集群上对FDTD算法的性能进行测试,对优化前后的计算结果以及GPU与CPU的计算性能进行了比较,并使用80块Tesla K20m GPU进行了可扩展性测试.从本文的研究结果可以看出,经过优化的FDTD算法性能有了较大的提升,而且FDTD算法在GPU集群上获得了比较理想的并行效率.

图形处理器 三维加速时域有限差分算法 数值模拟 可扩展性 精度分析

徐磊 徐莹 蒋荣琳 张丹丹

上海超级计算中心,上海201203

国内会议

2013全国高性能计算学术年会

桂林

中文

155-164

2013-10-29(万方平台首次上网日期,不代表论文的发表时间)