基于OpenCL的拉普拉斯图像增强算法优化研究
OpenCL是面向异构计算平台的通用编程框架,然而由于硬件体系结构的差异,如何在平台间功能移植的基础上,实现性能移植仍是有待研究的问题。当前已有算法优化研究一般只针对单一硬件平台,很难实现在不同平台上的高效运行。本文在分析了不同GPU平台底层硬件架构的基础上,从Global Memory的访存效率、GPU计算资源的有效利用率及其硬件资源的限制等多个角度考察了不同优化方法在不同GPU硬件平台上对性能的影响。并在此基础上实现了基于OpenCL的拉普拉斯图像增强算法,实验结果表明优化后的算法在不考虑数据传输时间的前提下,在AMD和NVIDIA GPU上都取得了3.7~136.1倍,平均56.7倍的性能加速,优化后的kernel比NVIDIA NPP库中相应函数也取得了12.3%~346.7%,平均143.1%的性能提升,验证了本文提出的优化方法的有效性和性能可移植性。
通用计算 拉普拉斯算法 跨平台 图像增强算法 可移植性
贾海鹏 张云泉 龙国平 徐建良 李焱
中国科学院 软件研究所 并行软件与计算科学实验室,北京 100190 中国海洋大学 信息科学与工程学院,青岛 266100 中国科学院 软件研究所 并行软件与计算科学实验室,北京 100190 中国科学院 软件研究所 计算机科学国家重点实验室,北京 100190 中国科学院 软件研究所 并行软件与计算科学实验室,北京 100190 中国海洋大学 信息科学与工程学院,青岛 266100 中国科学院 软件研究所 并行软件与计算科学实验室,北京 100190 中国科学院 研究生院,北京 100190
国内会议
2011年全国高性能计算学术年会(HPC china2011)
济南
中文
1-9
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)