快速多极方法计算主部的MIC并行性能优化
快速多极方法是科学与工程计算的典型算法之一,具有广泛用途.本文以求解位势问题为例,研究快速多极方法计算主部在集成众核(MIC)架构的并行计算及优化,涉及OpenMP线程并行、访存、数据通信、向量化等方面,分析比较了快速多极方法计算核心在优化前后的MIC和CPU性能加速.结果表明,快速多极方法计算主部在集成众核架构上获得了20.8的性能提升,单MIC卡性能相当于单结点双路CPU性能的1.95倍.
集成众核 并行计算 性能优化 快速多极方法
葛腾青 张理论
国防科技大学 计算机学院,湖南 长沙 410073 国防科技大学 计算机学院,湖南 长沙 410073;国防科技大学 并行与分布处理重点实验室,湖南 长沙 410073
国内会议
广州
中文
230-237
2014-11-06(万方平台首次上网日期,不代表论文的发表时间)