基于GPU的多层次并行QR分解算法研究
QR分解作为一个基本计算模块,广泛应用在图像处理、信号处理、通信工程等众多领域.传统的并行QR分解算法只能挖掘计算过程中的数据级并行.在分析快速Givens Rotation分解特征的基础上,提出了一种多层次并行算法,能够同时挖掘计算过程中的任务级并行和数据级并行,非常适合于以图形处理器(GPU)为代表的大规模并行处理器.同时,采用GPU的并行QR分解算法可以作为基本运算模块被GPU平台上的众多应用程序直接调用.实验结果显示,与CPU平台上使用OpenMP实现的算法相比,基于GPU的多层次并行算法能够获得5倍以上的性能提升,而调用QR分解模块的奇异值分解(SVD)应用可以获得3倍以上的性能提升.
多层次并行算法 图形处理器 数据挖掘 性能优化
穆帅 王晨曦 邓仰东
清华大学微电子所,北京100084
国内会议
中国计算机用户协会仿真应用分会成立三十周年庆祝大会暨2013全国仿真技术学术会议
呼和浩特
中文
234-238
2013-09-01(万方平台首次上网日期,不代表论文的发表时间)