基于CUPTI接口的GPU程序负载特征分析
基于GPU加速设备的高性能计算机已经成为目前高性能计算领域一个重要发展趋势.然而,在当前的GPU设备上开发高效的并行程序仍然是一件非常复杂的事情.针对这一问题,本文首先总结了影响GPU程序性能的几个关键性能指标.然后,采用NVIDIA公司提供的CUPTI底层接口,设计并实现了一套GPU程序性能分析工具集,该工具集可以有效地分析GPU程序的性能行为.最后,本文采用该工具集对著名的GPU评测程序集Rodinia中17个程序和一个真实应用程序进行了负载特征分析.总结出常见性能瓶颈的典型原因,并给出一些开发高效GPU程序的建议.
高性能计算机 加速设备 图形处理器 并行程序 负载特征 CUPTI接口
郑祯 翟季冬 李焱 陈文光
清华大学 计算机科学与技术系,北京市,100084
国内会议
广州
中文
76-87
2014-11-06(万方平台首次上网日期,不代表论文的发表时间)