会议专题

节点失效率相关的大规模机群系统作业调度策略

随着机群系统规模的扩大,节点失效已经成为大规模机群系统使用过程中一个不可回避的问题.传统的机群作业调度策略为了体现作业调度的公平性和资源的充分利用而考虑了诸如作业优先级、节点负载等因素,而没有考虑节点失效率的影响.机群作业调度功能上可分为作业选取和节点分配两部分.本文提出了一种节点失效率相关的作业调度策略,在节点分配过程中根据节点的失效率特征,选择可靠性高的节点投入使用,并使用基于事件驱动的离散事件仿真方法进行了性能分析.仿真结果表明,在调度策略中考虑节点失效率特征,可以提高作业调度系统的性能.

大规模机群系统 节点失效率 作业调度 节点分配

沈岳

北京城市学院,北京,100094

国内会议

2006年全国高性能计算学术会议(HPC 2006)

北京

中文

2006-10-27(万方平台首次上网日期,不代表论文的发表时间)