基于CUDA实现MRRR算法并行
MRRR(Multiple Relatively Robust Representations)算法是求解对称三对角矩阵本征值问题高效、精确的算法之一。在分析MRRR算法及CUDA(Compute Unified Device Architecture)并行体系结构的基础上,针对算法可并行性,采用单指令多线程并行方式实现了基于CUDA的MRRR算法并行,并从存储结构方面优化算法。实验结果显示,与LAPACK库中串行MRRR实现相比并行方法在保证精度的基础上获得了20倍的加速比,进而从计算精度和计算时间上说明MRRR算法适合在GPU上并行。
对称三对角矩阵 本征值 并行体系 统一计算架构 存储结构 优化算法
汪丽杰 赵永华
中国科学院计算机网络信息中心 超算中心 北京 100190
国内会议
2011年全国高性能计算学术年会(HPC china2011)
济南
中文
1-5
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)