基于计算缓存方法的分子动力学程序性能优化
分子动力学数值模拟程序在现代高性能计算机上的计算效率往往很低,只能发挥系统峰值性能的几个百分点。本文对并行分子动力学程序PMD3D在联想深腾6800超级计算机上进行性能优化。通过性能分析,发现粒子相互作用力计算中相互关联的浮点运算严重影响了处理器的指令级并行效率,为此应用计算缓存的方法,将大量不规则的浮点计算进行缓存,达到一定规模后再进行向量化计算。这样使得单机性能在优化后提升4倍多,达到处理器峰值性能5.2GFlops的32.3%。最后,在深腾6800的64个节点的256个CPU上进行了并行性能测试,达到峰值运算性能1.3万亿次的27%。
分子动力学 性能优化 计算缓存 指令级并行 数值模拟
张宝印 莫则尧 曹小林
北京应用物理与计算数学研究所,北京,100094
国内会议
哈尔滨
中文
77-79,83
2009-08-07(万方平台首次上网日期,不代表论文的发表时间)