不同层次MPI并行程序容错的比较
随着超级计算机系统规模的不断扩大和系统结构的日益复杂,系统容错已经成为大规模超级计算机系统必须解决的一个关键问题.MPI并行程序的容错也日益受到关注,其中检查点设置和回卷恢复是MPI并行程序容错中一种重要的容错技术.本文对MPI标准、各种版本MPI实现的容错情况及检查点设置/回卷恢复的容错技术进行了介绍,给出了深腾7000上不同层次MPI并行程序的容错实例和性能测试结果,最后对不同层次MPI并行程序容错的开销进行了分析比较.
计算机系统 容错技术 并行程序 性能测试
Zhao Yi 赵毅 Cao Zongyan 曹宗雁 Zhu Peng 朱鹏 Chi Xuebin 迟学斌
Super Computing Center, Computer Network Information Center, Chinese Academy of Sciences, Beijing 10 中国科学院计算机网络信息中心,北京 100190
国内会议
青岛
中文
14-21
2011-11-06(万方平台首次上网日期,不代表论文的发表时间)