会议专题

稀疏矩阵向量乘的访存分析和优化

  稀疏矩阵向量乘(SpMV)是科学计算中最重要的核心算法之一。理论分析和实际测试结果都表明,SpMV属于访存密集型应用。由于目前主流编译器尚不能充分利用现代处理器的访存特性,SpMV对带宽利用率仅为10%。本文通过探索现代处理器的访存特征,使用单指令流多数据流(SIMD)对SpMV进行流水线访存优化。实验表明与标准SpMV相比,优化后的SpMV在Intel Nehalem和SandyBridge架构上流水线性能分别有63%和89%的提升,在AMD Opteron 6168和Opteron 8374 HE上分别有30%和36%的提升。SpMV在实际矩阵进行的性能测试中,Intel Nehalem和SandyBridge架构上均有10%的性能提高。

稀疏矩阵向量乘 流水线 科学计算 访存特性 处理器 单指令流多数据流 性能测试

张秀霞 陈明宇 李佳佳 谭光明

中国科学院计算技术研究所,北京100190

国内会议

2011年全国高性能计算学术年会(HPC china2011)

济南

中文

1-4

2011-10-26(万方平台首次上网日期,不代表论文的发表时间)