基于Infiniband 的系统级保留恢复
随着Infiniband在HPC系统互连领域所占份额日趋扩大,用户迫切需要一种能够利用Infiniband优化性能同时又具有容错功能支持高可 用的MPI编程模型。本文提出了一种适合Infiniband的MPI容错协议,据此推出一个对应用透明的支持系统级保留恢复的原型系统。该系统通过了NAS、PMB 和多道应用课题512-1200个核规模的测试。
高性能计算 程序设计 容错协议 编程模型
王敬宇 周明忠 尹万旺 许国春 许国春
国内会议
无锡
中文
486
2008-10-30(万方平台首次上网日期,不代表论文的发表时间)