基于有限二叉树布隆过滤器的去冗文件系统
在大数据存储,尤其是云存储的应用中,去冗文件系统可以减少冗余文件片段的存储,从而节省大量存储空间.但是当前已有的去冗文件系统的实现需要用到较大的动态文件块索引,导致文件系统的访问延迟和高内存占用.为了解决这个问题,本将森林型布隆过滤器和二阶段布隆过滤器相结合,创造出了兼具文件块查询和文件块定位功能的新型二叉树布隆过滤器(LBTBF).基于二叉树布隆过滤器设计的单机去冗文件系统可以存储大量的不同种类文件集,并且实现了高读写速度和高去冗率.在设计方案中,系统采用流水线的思想,将文件块的输入输出与其他操作相分离,并为二阶段布隆过滤器增加了计数器,使其支持文件块的删除,从而减少存储空间的浪费.依托森林型布隆过滤器的特性,在实现过程中系统只需将少数几个树结节的完整信息及一些树结节的部分信息载入内存.
大数据存储 去冗文件系统 二叉树布隆过滤器 读写速度 去冗率
刘俊龙 王星河 姜博 龙翔 高小鹏 万寒
北京航空航天大学大学计算机学院,北京100191
国内会议
武汉
中文
119-128
2013-09-01(万方平台首次上网日期,不代表论文的发表时间)