流处理器上典型矩阵程序Jacobi和GEMM的长流分段技术
长流分段是提高流处理器上流寄存器文件(Stream Register File,简称SRF)带宽利用率的关键技术.其中,选择合适的优化策略(预取或重用)是确定最优分段的基础. 本文以典型的矩阵程序Jacobi和GEMM为例,研究了确定给定程序的优化策略和分段决策的技术,重点研究了有效重用度对程序优化策略选择的影响.实验结果表明,经过长流分段的Jacobi和GEMM程序能够有效避免和隐藏片外访存延迟,提高SRF的带宽利用率。
矩阵程序 流处理器 长流分段 优化策略
杜静 敖富江 彭珲 王桂彬 杨学军
国防科技大学计算机学院,湖南 长沙 410073 中国人民解放军63892部队,河南 洛阳 471003
国内会议
2008年中国计算机学会体系结构专委会学术年会(ACA”08)
南京
中文
133-136,168
2008-11-05(万方平台首次上网日期,不代表论文的发表时间)