会议专题

一种并行作业任务启动模型及其扩展性分析

随着高性能计算机系统规模的不断扩大,作业启动的时间越来越长,大作业的启动时间逐渐成为影响系统规模扩展的一个重要因素.同时,元器件数目快速增长带来的更频繁的故障也使大规模并行应用在完成前可能经历多次反复提交,因此作业任务的启动效率也直接影响着系统计算资源的有效利用率和用户使用体验.本文介绍了一种层次式并行作业任务启动模型,对其在不同作业规模下的性能进行了测试、分析与优化.经过优化后该模型能够支持一个大规模系统的作业任务启动与控制,并具备较好的扩展性.

高性能计算机 并行作业任务启动模型 可扩展性

宋长明 龚道永 张宏宇

江南计算技术研究所 江苏无锡 214000

国内会议

2013全国高性能计算学术年会

桂林

中文

382-387

2013-10-29(万方平台首次上网日期,不代表论文的发表时间)