会议专题

MPIAlltoall通信在多核机群中的优化

  MPI Alltoall通信作为一种重要的集合通信,在高性能应用中广泛使用。在多核机群中,一个结点内的多个进程同时参与Alltoall通信。一方面,这些进程可以利用共享内存优化通信性能。虽然当前基于首进程(Leader-based)的方法利用共享内存提高了Alltoall小消息通信的性能,但由于采用固定数目的首进程,这些方法不能使所有的Alltoall小消息通信都获得最优性能。另一方面,这些进程需要竞争结点内有限的网络资源。在Alltoall大消息通信中,存在许多个同步消息,然而竞争导致这些同步消息的延迟增大了数十倍,同步开销占整个Alltoall通信的很大比例。在本文中,我们针对这些问题提出了不同的优化方法。对于Alltoall小消息通信,PLP方法根据小消息的长度采用不同数目的首进程;对于Alltoall大消息通信,LSS方法将同步消息的总数从减少到。通过实验,我们验证了这两种方法。对于Alltoall小消息通信,PLP方法总是可以获得最优的性能。对于Alltoall大消息通信,LSS方法获得的性能提升比例几乎为常数,其与系统的规模无关;对于32K和64K字节的消息,它们的性能提高了25%。

首进程数目 同步开销 集合通信 多核机群 共享内存

李强 孙凝晖 霍志刚 马捷

中国科学院计算技术研究所高性能计算机研究中心 北京 100190 中国科学院计算机系统结构重点实验室 北京 100190 中国科学院研究生院 北京 100039 中国科学院计算技术研究所高性能计算机研究中心 北京 100190 中国科学院计算机系统结构重点实验室 北京 100190 中国科学院计算技术研究所高性能计算机研究中心 北京 100190

国内会议

2011年全国高性能计算学术年会(HPC china2011)

济南

中文

1-12

2011-10-26(万方平台首次上网日期,不代表论文的发表时间)