格子Boltzmann并行程序的优化与性能分析
基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减少80%的Cache缺失,性能提高20%,而且经过预处理的并行程序性能也有很大提高.
格子Boltzmann Cache优化 内存优化 并行计算 并行程序
赵鹏 张丹丹 汪鲁兵 田振夫 钱跃竑
上海大学力学所,上海,200072 上海超级计算中心,上海,201203 复旦大学力学与工程科学系,上海,200443
国内会议
扬州
中文
185-188
2008-10-25(万方平台首次上网日期,不代表论文的发表时间)