Intel Knights Corner的结点级内存访问优化
传统编程优化(Traditional Programming Optimization,简称TPO)在Intel Knights Corner(简称KNC)上收效甚微.提出必须重视内存访问优化(Memory Access Optimization,简称MAO).将MAO应用到Diffusion 3D这个已经过TPO的程序上后发现性能仍然提高了39.1%.本文主要有2个贡献:1)提出MAO,认为TPO+MAO有助于在KNC上获取最优化性能;2)发现对于stencil代码,基于intrinsic的MAO比基于编译器的MAO要高效.这些发现对于在KNC上优化大规模应用有启发意义.
传统编程优化 结点级 内存访问 性能评价
林新华 李硕 赵嘉明 松岗聪
上海交通大学 高性能计算中心,上海 200240;东京工业大学 学术国际情报中心,日本 Intel公司,软件与服务部门,美国 上海交通大学 高性能计算中心,上海 200240 东京工业大学 学术国际情报中心,日本
国内会议
广州
中文
897-900
2014-11-06(万方平台首次上网日期,不代表论文的发表时间)