会议专题

异构环境下高能物理规模作业管理系统的设计与实现

高能物理实验作业任务量大、处理耗时,一个作业通常要拆分为大规模的作业集进行处理.作业会被提交到部署在本地、网格、云等异构资源上的调度系统.同时,不同的高能物理实验,在作业描述和处理过程上有相似之处.本文研究了一种通用、易扩展的作业提交管理系统(JSUB)的设计与实现.JSUB整合了不同的需求和资源,兼容多个实验(如BESIII,CEPC,JUNO等)和多个后端处理系统(如DIRAC,HTCondor,PBS/Torque等),对用户尽可能地屏蔽其差异性,方便了用户对资源的访问.本文根据当前高能物理实验中对规模作业提交管理的需求和对相关工作的分析,提出了支持多实验多后端的作业管理系统,描述了主要功能模块和系统架构.然后重点介绍了核心组件及作业提交流程.

高能物理实验 作业管理 软件开发 功能模块

索兵 贺红 颜田 赵祥虎 张晓梅 李卫东

山东大学(威海),威海 264209 中国科学院高能物理研究所,北京 100049

国内会议

第十七届全国科学计算与信息化会议暨智慧科研论坛

合肥

中文

267-271

2015-08-17(万方平台首次上网日期,不代表论文的发表时间)