有限元网格积分算法在MIC众核平台上的并行实现
本文针对有限元网格积分算法基于英特尔集成众核(Many Integrated Core,MIC)架构在至强融核(Xeon Phi)协处理器做了移植和性能分析.该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(offload)下利用OpenMP在MIC上的线程并行化.计算性能测试结果显示集成众核平台可以有效的加速有限元网格积分算法:1、一块被充分利用的MIC设备卡(3115A)的计算能力超过两路16核Intel XeonTM E5-2670 CPU;2、MIC并发的物理线程可能由于公共缓存访问存在竞争而降低程序的扩展性.测试结果还显示了在多CPU多MIC平台上进一步移植完整的MPI并行有限元模拟软件的可行性.本文的工作有助于推动与有限元网格相关的科学和工程高性能计算的工作.
有限元网格积分算法 集成众核平台 卸载模式 线程并行化
寇大治 孔大力
上海超级计算中心,上海 201203 埃克塞特大学数学系,埃克塞特市 英国 EX4 4QF
国内会议
广州
中文
905-908
2014-11-06(万方平台首次上网日期,不代表论文的发表时间)