会议专题

机群系统中用户级、零拷贝并行通信协议

机群目前已成为高性能计算机和超级服务器的主流体系结构,对机群系统中高性能系统域网(System Area Network)的可扩展性与可用性要求也越来越高.基于使用多套系统域网实现机群系统中结点间互连和消息传递的并行通信能够很好地满足上述需求.本文提出了一种用户级、零拷贝并行通信协议,对目前广泛使用的用户级、零拷贝高效通信协议进行了扩展,增加了并行通信机制.使用该协议,用户的一个消息经分片能够通过多层系统域网同时进行传输,并保证消息间的有序性.消息的并行传输对用户透明.该协议已经在曙光4000L Linux超级服务器的底层通信软件BCL4中实现.测试结果表明,在两套Myrinet网上BCL4的通信带宽达到413MB/s,是单套网络测得带宽的1.88倍,而通信延迟基本保持不变.

机群 并行通信 用户级通信 消息分片 通信协议

孟丹 马捷 霍志刚 高帆

中国科学院计算技术研究所(北京)

国内会议

2003中国计算机大会

北京

中文

1098-1104

2003-11-01(万方平台首次上网日期,不代表论文的发表时间)