会议专题

基于OpenCL的addWeighted和magnitudeSqr算法性能优化研究

  目前GPU已经成为提高算法性能的一个重要途径,OpenCL 是一个为异构平台编写程序的框架,此异构平台可由CPU、GPU 或其他类型的多核/众核处理器组成.本文主要介绍基于OpenCL 框架在GPU 上对开源视觉库(OpenCV)中访存密集型函数addWeighted 和magnitudeSqr 进行实现和优化,优化方法主要有向量化读取,NDrange 优化和内存对齐,并将结果与CPU,CUDA 进行了对比分析,相较于CPU 版本最高达到了74.4 的加速比.

图形处理器 开放计算语言 矩阵运算函数 性能优化

Zhang Long 张龙 Zhang Yun-quan 张云泉 Long Guo-ping 龙国平 Jia Hai-peng 贾海鹏 Yan Shen-gen 颜深根

Laboratory of Parallel Software and Computational Science,Institute of Software,Chinese Academy of S 中国科学院软件研究所并行软件与计算科学实验室,北京100190;中国科学院研究生院,北京100190 Laboratory of Parallel Software and Computational Science,Institute of Software,Chinese Academy of S 中国科学院软件研究所并行软件与计算科学实验室,北京100190;中国科学院软件研究所计算机科学国家重点实验室,北京100190 Laboratory of Parallel Software and Computational Science,Institute of Software,Chinese Academy of S 中国科学院软件研究所并行软件与计算科学实验室,北京100190 Laboratory of Parallel Software and Computational Science,Institute of Software,Chinese Academy of S 中国科学院软件研究所并行软件与计算科学实验室,北京100190;中国海洋大学信息科学与工程学院,青岛266100 Laboratory of Parallel Software and Computational Science,Institute of Software,Chinese Academy of S 中国科学院软件研究所并行软件与计算科学实验室,北京100190;中国科学院软件研究所计算机科学国家重点实验室,北京100190;中国科学院研究生院,北京100190

国内会议

2012全国高性能计算学术年会

张家界

中文

1-8

2012-10-29(万方平台首次上网日期,不代表论文的发表时间)