会议专题

高可靠性集群中MPI的设计与实现

高可靠性集群软件系统主要由三部分组成:事件日志系统、检查点系统和MPI环境.本文介绍了一种为高可靠性集群设计的MPI实现SW-MPIFT,阐述了其基于悲观消息日志与非一致性检查点相结合的容错协议.并通过与其他MPI实现的比较说明了其特点.

高可靠性集群 SW-MPIFT 检查点系统 事件日志系统

尹万旺 周明忠

江南计算技术研究所,无锡,214083

国内会议

2006年全国高性能计算学术会议(HPC 2006)

北京

中文

2006-10-27(万方平台首次上网日期,不代表论文的发表时间)