基于计算缓存方法的分子动力学程序性能优化

摘要：

分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PMD3D在联想深腾6800超级计算机上进行性能优化。通过性能分析,发现粒子相互作用力计算中相互关联的浮点运算严重影响了处理器的指令级并行效率,为此应用计算缓存的方法,将大量不规则的浮点计算进行缓存,达到一定规模后再进行向量化计算。这样使得单机性能在优化后提升4倍多,达到处理器峰值性能5.2GFlops的32.3％。最后,在深腾6800的64个节点的256个CPU上进行了并行性能测试,达到峰值运算性能1.3万亿次的27％。

关键词：分子动力学性能优化计算缓存指令级并行数值模拟

作者: 张宝印莫则尧曹小林

作者单位: 北京应用物理与计算数学研究所,北京,100094

会议类型: 国内会议

会议名称: 2009年全国理论计算机科学学术年会

会议地点: 哈尔滨

会议语种:中文

页码: 77-79,83

在线出版日期: 2009-08-07（万方平台首次上网日期，不代表论文的发表时间）

会议专题

基于计算缓存方法的分子动力学程序性能优化