会议专题

基于压力反馈的MapReduce负载均衡策略

数据倾斜是严重影响MapReduce性能的因素之一.数据倾斜问题的现有解决方法需要用户对应用类型提供针对的分区函数,或是为MapReduce编写额外的采样过程,增加了用户的负担.为解决上述问题,提出了一种基于压力统计的负载均衡策略.该策略充分利用MapReduce中的混洗阶段,在reducer准备数据的同时进行统计,以获取全局数据分布.系统根据数据分布情况对负载较重节点进行调度,平衡整个集群负载,而无需用户提供额外的输入.此外,考虑到上层不同的应用类型,引入了压力反馈机制来进一步提高调度策略的性能.实验结果表明,提出的负载均衡调度策略的性能优于默认策略性能.

MapReduce编程模型 数据倾斜 负载均衡策略 压力反馈

李航晨 秦小麟 沈尧

南京航空航天大学计算机科学与技术学院 南京210016

国内会议

2014湖北省计算机学会学术年会

宜昌

中文

141-146

2014-10-31(万方平台首次上网日期,不代表论文的发表时间)