会议专题

GRC:一种适用于多节点失效的高容错低修复成本纠删码

作为云计算重要基础的大规模分布式容错存储系统,采用纠删码作为数据冗余技术能比多副本技术以更低的存储开销获得相同的数据可靠性.然而,过高的修复成本使纠删码技术在实际中的应用受到限制.已有的改进工作虽然可以降低成本,但在多节点失效修复的成本过高.本文提出一种适用于多节点失效的高容错低修复成本纠删码——分组修复码(Group Repairable Codes,简称GRC).GRC码通过将条带分组并增加组编码块,显著减少了修复所要传输的数据量,从而节省了宝贵的网络带宽和磁盘I/0资源;GRC码通过多个组编码块在多节点失效时降低修复成本,且维持较好容错能力.根据GRC码的特征,本文提出基于贪心策略的解码算法GSBD(Greedy Strategy Based Decode Algorithm),GSBD通过保证每个失效块的修复成本最小以优化修复过程.实验结果显示,与RS码相比,GRC码将修复网络带宽和磁盘I/O降低50%-55%,修复速度提高75%-90%,仅需增加21%存储空间;与LRC码相比,GRC码将修复网络带宽和磁盘I/O降低35%-45%,修复速度提高40%-50%,仅需增加13%存储空间;与Basic Pyramid Code(简称BPC)相比,GRC码将修复网络带宽和磁盘I/O降低15%-25%,修复速度提高20%-25%,仅需增加6%存储空间.

分布式存储系统 分组修复码 容错能力 修复成本 数据可靠性

林轩 王意洁 裴晓强 许方亮 符永铨

国防科学技术大学计算机学院并行与分布处理国家重点实验室 长沙410073

国内会议

第二届CCF大数据学术会议

北京

中文

1-9

2014-12-01(万方平台首次上网日期,不代表论文的发表时间)