会议专题

基于Agent的分布式存储系统故障检测技术

当前的分布式并行文件系统与数据库系统在存储容量、访问性能、可靠性、可扩展性等方面都不能很好地满足数据密集型应用的需求,基于集群的存储系统也存在一定的不足.针对这一问题,提出了一种PC存储集群解决方案,采用3层Agent结构构建了一个分布式存储系统,介绍了基于主从备份方式的系统可靠性模型,详细阐述了检查点检测和心跳检测相结合的故障检测方法,分析故障检测带来的系统开销并加以改进.数学分析表明,新系统具有较高的可靠性与较低的通信开销.

代理 分布式存储 冗余 可靠性 故障检测

杨晓晖 杨敬伟 马晓雪 田俊峰

河北大学数学与计算机学院,保定,071002

国内会议

第二届中国可信计算与信息安全学术会议

河北保定

中文

556-560

2006-10-21(万方平台首次上网日期,不代表论文的发表时间)