会议专题

基于多核阵列体系结构的嵌套循环并行优化

多核处理器已广泛应用于高性能计算领域,如何有效地将传统串行程序转换为并行代码并减少程序中嵌套循环所占用时间仍是该领域的挑战性问题。本文首先基于多面体模型对嵌套循环进行依赖特征分析并实现瓦片分割,据此自动生成粗粒度并行代码。针对多核阵列处理器的结构特点,采用遗传算法生成通信优化的瓦片任务序列,在此基础上建立了有效的任务调度模型。最后将上述方法应用于LU分解,结果表明该方法与传统调度算法相比,在增加数据局部性,实现负载平衡方面具有更好效果。

多核处理器 嵌套循环 多核阵列 体系结构 并行优化

杨子煜 严明 赵鹏

国防科技大学计算机学院,湖南 长沙 410073

国内会议

2009年全国高性能计算学术年会

长沙

中文

125-128

2009-10-23(万方平台首次上网日期,不代表论文的发表时间)