会议专题

GCC中紧嵌套循环坍缩的并行化和向量化

在多媒体处理及科学计算等应用程序中嵌套循环占用了相当部分的执行时间,故有效处理嵌套循环、提高嵌套循环的运行效率的研究越来越受关注。OpenMP3.0规范中的collapse从句能指导编译器进行紧嵌套循环的并行化.最新OpenMP4.0规范中新增了用于指导循环向量化的simd结构,它也支持collapse从句,指导编译器进行紧嵌套循环的向量化.当前,GCC4.9已基本实现了OpenMP4.0规范,但实验表明它对collapse从句的支持并不理想,甚至阻碍嵌套循环的成功向量化.

程序设计 紧嵌套循环 编译器 并行化 向量化

徐颖 李春江 董钰山

湖南省长沙市国防科技大学计算机学院 410073

国内会议

第十八届计算机工程与工艺年会暨第四届微处理器技术论坛

贵阳

中文

645-651

2014-07-31(万方平台首次上网日期,不代表论文的发表时间)