会议专题

流处理器上典型矩阵程序Jacobi和GEMM的长流分段技术

长流分段是提高流处理器上流寄存器文件(Stream Register File,简称SRF)带宽利用率的关键技术.其中,选择合适的优化策略(预取或重用)是确定最优分段的基础. 本文以典型的矩阵程序Jacobi和GEMM为例,研究了确定给定程序的优化策略和分段决策的技术,重点研究了有效重用度对程序优化策略选择的影响.实验结果表明,经过长流分段的Jacobi和GEMM程序能够有效避免和隐藏片外访存延迟,提高SRF的带宽利用率。

矩阵程序 流处理器 长流分段 优化策略

杜静 敖富江 彭珲 王桂彬 杨学军

国防科技大学计算机学院,湖南 长沙 410073 中国人民解放军63892部队,河南 洛阳 471003

国内会议

2008年中国计算机学会体系结构专委会学术年会(ACA”08)

南京

中文

133-136,168

2008-11-05(万方平台首次上网日期,不代表论文的发表时间)