自适应混合高斯背景建模算法的GPU并行优化
通过利用GPU 平台上的CUDA 编译环境,从线程级并行和异步流处理并行两个方面对自适应混合高斯背景建模算法进行并行优化。线程级并行化主要是利用CUDA 的内核函数(kernel),将原算法里的每一个像素的背景更新过程映射到GPU 的一个流处理单元上进行处理,通过多线程的并行执行来加速计算速度。异步流处理优化利用CUDA 编程模型中的流概念,使每个流之间的数据传输和计算重叠进行,隐藏数据传输所带来的时延,从而加速计算过程。实验结果表明,通过线程级并行化和异步流处理优化后,确实可以大幅度地加速混合高斯背景建模算法的执行过程。
混合高斯背景建模 图形处理器 流计算 线程级并行 并行编程模型
郭红星 钟俊杰 余胜生 张爱华
华中科技大学 计算机科学与技术学院,武汉430074
国内会议
第21届全国多媒体技术、第8届全国普适计算、第8届全国人机交互联合学术会议
广州
中文
1-6
2012-11-23(万方平台首次上网日期,不代表论文的发表时间)