面向异构架构的混合精度有限元算法及其CUDA 实现
长期以来,单精度似乎与科学计算无缘,然而从体系结构看,混合精度计算可以充分发挥向量部 件、GPGPU 设备的单精度性能,提供更高效能,如降低通讯带宽要求、提高数据传输和通讯效率等。混合精 度显格式有限元算法,结合材料强非线性多尺度有限元程序msFEM,实现了GPGPU 上的有效加速。实验结果 表明:混合精度显格式有限元实现了90%以上的计算通过单精度完成而计算结果与全部使用双精度结果相一 致的效果。该算法可以使得在不支持双精度格式的加速卡上,实现科学计算功能。在支持双精度浮点格式的 GPU 上,混合精度算法又可以与全部采用双精度计算的加速效果进一步提高1.6-1.7 倍。
混合精度算法 有限元 并行计算 异构架构 通用计算图形处理单元 浮点运算
刘建华 王朝尉 任江勇 田荣
中国科学院计算技术研究所高性能计算机研究中心 北京 100190
国内会议
2011年全国高性能计算学术年会(HPC china2011)
济南
中文
1-6
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)