FMM算法中PP问题在GPU上的研究与实现

FMM算法是20 世纪最伟大的十大算法之一”2”,由于是一种树形算法,要把其移植到GPU 上是一件极 富挑战性的工作。目前FMM的并行算法已有相当多的研究和实现,PetFMM ”1”就是其中一种比较优秀的并行算 法实现。本文主要对PetFMM 中运行时间相对较大的PP 问题做出改进,使其能适合在GPU的SIMD 结构上运行。在整个FMM 程序中PP 问题在树层数较少时,是整个算法的瓶颈,但经过本文所述的方法优化后,能够明 显地减少PP 问题的计算时间,提高了整个程序的运行效率。本文利用GPU 进行加速后与同样的算法程序在CPU上运行比较,PP 问题最高可提高60多倍。
FMM PetFMM PP 问题 CUDA GPU
李正杰 徐炜民 柴亚辉 郑衍衡
上海大学计算机工程与科学学院,上海 20072 上海大学计算机工程与科学学院,上海 20072;上海大学高性能计算中心,上海 20072 上海大学计算机工程与科学学院,上海 200072
国内会议
2010年全国高性能计算学术年会(HPC china2010)
北京
中文
260-266
2010-10-27(万方平台首次上网日期,不代表论文的发表时间)