MPIAlltoall通信在多核机群中的优化

摘要：

　　MPI Alltoall通信作为一种重要的集合通信，在高性能应用中广泛使用。在多核机群中，一个结点内的多个进程同时参与Alltoall通信。一方面，这些进程可以利用共享内存优化通信性能。虽然当前基于首进程（Leader-based）的方法利用共享内存提高了Alltoall小消息通信的性能，但由于采用固定数目的首进程，这些方法不能使所有的Alltoall小消息通信都获得最优性能。另一方面，这些进程需要竞争结点内有限的网络资源。在Alltoall大消息通信中，存在许多个同步消息，然而竞争导致这些同步消息的延迟增大了数十倍，同步开销占整个Alltoall通信的很大比例。在本文中，我们针对这些问题提出了不同的优化方法。对于Alltoall小消息通信，PLP方法根据小消息的长度采用不同数目的首进程；对于Alltoall大消息通信，LSS方法将同步消息的总数从减少到。通过实验，我们验证了这两种方法。对于Alltoall小消息通信，PLP方法总是可以获得最优的性能。对于Alltoall大消息通信，LSS方法获得的性能提升比例几乎为常数，其与系统的规模无关；对于32K和64K字节的消息，它们的性能提高了25％。

关键词：首进程数目同步开销集合通信多核机群共享内存

作者: 李强孙凝晖霍志刚马捷

作者单位: 中国科学院计算技术研究所高性能计算机研究中心北京 100190 中国科学院计算机系统结构重点实验室北京 100190 中国科学院研究生院北京 100039 中国科学院计算技术研究所高性能计算机研究中心北京 100190 中国科学院计算机系统结构重点实验室北京 100190 中国科学院计算技术研究所高性能计算机研究中心北京 100190

会议类型: 国内会议

会议名称: 2011年全国高性能计算学术年会(HPC china2011)

会议地点: 济南

会议语种:中文

页码: 1-12

在线出版日期: 2011-10-26（万方平台首次上网日期，不代表论文的发表时间）

会议专题

MPIAlltoall通信在多核机群中的优化