会议专题

Detector:一种可共享的机群状态侦测服务

为了支持单一系统映像,一个完整的机群系统都能提供一整套完整的软件系统,例如管理软件、监控软件以及编程环境等等.目前,大多数的机群系统软件子系统都是一种自包含的结构,这样原本一些在各个子系统中可以公用的功能部件被独立实现,带来软件功能部件的冗余和系统执行效率的低下.机群系统的状态侦测就是这样一个可以公用的功能部件,它可以被系统监控、资源管理和系统管理等等机群软件子系统所共享.因此,在开发曙光机群操作系统DCOS中,我们设计开发了一种可共享的机群侦测服务-Detector,用来侦测机群系统中的软硬件状态.本文主要从动机、关键问题、功能、设计和特征几个方面描述了Detector的设计和实现.

共享服务 状态侦测 Detector 机群 网格

叶庆华 高文 孟丹

国家智能计算机研究开发中心,中国科学院计算技术研究所,北京2704信箱,100080

国内会议

中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会

四川广元

中文

417-425

2002-07-13(万方平台首次上网日期,不代表论文的发表时间)