会议专题

基于延迟隐藏因子的GPU计算模型

  近年来在生物计算,科学计算等领域成功地应用了GPU 加速计算并获得了较高加速比.然而在GPU 上 编程和调优过程非常繁琐,为此,研究人员提出了许多提高编程效率的编程模型和编译器,以及指导程序优化的 计算模型,在一定程度上简化了GPU 上的算法设计和优化,但是已有工作都存在一些不足.针对GPU 低延迟高 带宽的特性,提出了基于延迟隐藏因子的GPU 计算模型,模型提取算法隐藏延迟的能力,以指导算法优化.利用三种矩阵乘算法进行实测与模型预测,实验结果表明,在简化模型的情况下,平均误差率为0.19.

GPU 通用计算 计算模型 性能模型 延迟隐藏因子 GPU 性能优化

袁良 张云泉 王可 张先轶

中国科学院软件研究所并行软件与计算科学实验室, 北京 100190;中国科学院计算机科学国家重点实验室, 北京 100190;中国科学院研究生院, 北京 100049 中国科学院软件研究所并行软件与计算科学实验室, 北京 100190;中国科学院计算机科学国家重点实验室, 北京 100190 中国科学院软件研究所并行软件与计算科学实验室, 北京 100190

国内会议

2010年全国高性能计算学术年会(HPC china2010)

北京

中文

275-286

2010-10-27(万方平台首次上网日期,不代表论文的发表时间)