会议专题

FMM算法中PP问题在GPU上的研究与实现

  FMM算法是20 世纪最伟大的十大算法之一”2”,由于是一种树形算法,要把其移植到GPU 上是一件极 富挑战性的工作。目前FMM的并行算法已有相当多的研究和实现,PetFMM ”1”就是其中一种比较优秀的并行算 法实现。本文主要对PetFMM 中运行时间相对较大的PP 问题做出改进,使其能适合在GPU的SIMD 结构上运行。在整个FMM 程序中PP 问题在树层数较少时,是整个算法的瓶颈,但经过本文所述的方法优化后,能够明 显地减少PP 问题的计算时间,提高了整个程序的运行效率。本文利用GPU 进行加速后与同样的算法程序在CPU上运行比较,PP 问题最高可提高60多倍。

FMM PetFMM PP 问题 CUDA GPU

李正杰 徐炜民 柴亚辉 郑衍衡

上海大学计算机工程与科学学院,上海 20072 上海大学计算机工程与科学学院,上海 20072;上海大学高性能计算中心,上海 20072 上海大学计算机工程与科学学院,上海 200072

国内会议

2010年全国高性能计算学术年会(HPC china2010)

北京

中文

260-266

2010-10-27(万方平台首次上网日期,不代表论文的发表时间)