会议专题

基于Charm++并行平台的宇宙学流体模拟异构计算应用容错研究

目前容错问题已成为大规模并行程序长时间运行中不可回避的问题.本文针对由CPU和GPU组成的异构并行系统中的硬件故障问题,面向大规模的计算宇宙学应用,利用Charm++并行平台提出并实现了一种有效的应用容错机制.并通过实验和分析,验证了算法的高效性和可行性,不仅提高了该计算在超级计算环境中的可靠性.也为下一步更高效普适的异构容错算法的研究奠定了基础.

宇宙学流体模拟 应用容错算法 异构并行程序

孟晨 曹宗雁 王龙 迟学斌

中国科学院计算机网络信息中心超级计算中心,北京100190;中国科学院大学,北京100049 中国科学院计算机网络信息中心超级计算中心,北京100190

国内会议

2013全国高性能计算学术年会

桂林

中文

212-220

2013-10-29(万方平台首次上网日期,不代表论文的发表时间)