会议专题

利用ARC CE整合异构计算平台

ARC(AdvancedResource Connector)CE(Computing Element)是Nordugrid开发的网格中间件中的对计算资源管理的组件.ARC CE相对于其他的对等计算资源网格组件,具有轻量级,易管理,认证简单,易扩展的特性,因此越来越广泛地被应用于各类网格应用平台上.高能物理实验ATLAS具有数据量大,计算量大的特点,采用了网格计算的方式整合了位于全球上百个计算中心的15万个CPU核进行协同计算.随着ATLAS Run2阶段开始,其所需计算资源急速增长,因此ATLAS在积极探索使用云计算资源,超算资源(HPC),志愿计算资源等.如何将这些异构的计算资源整合到ATLAS传统的网格计算平台,成为一个急需解决的重要问题.ARC CE由于所具有的易扩展和轻认证的属性,于是成为这一解决方案的核心组件.本文将以志愿计算为例,阐述如何利用ARC CE将动态的、不可信的志愿计算资源平台整合到现有的ATLAS网格计算环境,实现对用户和网格服务的双透明性.ARC CE由于其轻量级、易扩展性,以及分离的认证机制,很适合用于桥接网格计算平台和其它的非网格的异构计算平台(云计算平台,志愿计算平台,超级计算机平台),实践证明利用ARC CE能将ATLAS的网格作业系统PanDA能够无缝地桥接到BOINC管理的志愿计算平台,而无需更改PanDA或者BOINC的任何设置,也成功避免了将个人代理证书置于不可信的志愿主机之上。采取这一系统架构,使得任何异构的计算平台都能够透明地被整合到网格计算平台之上,也可以为其它类似的需求所借鉴。经过一年多时间的生产系统的稳定运行,证明了这一系统架构的稳定性和可扩展性(可以增加更多的志愿主机)。

网格组件 志愿计算 资源整合 异构系统

伍文静

中科院高能物理研究所计算中心,北京 100049

国内会议

第十七届全国科学计算与信息化会议暨智慧科研论坛

合肥

中文

206-213

2015-08-17(万方平台首次上网日期,不代表论文的发表时间)