面向SIMD的数组重组和对齐优化
随着多媒体应用的普及,越来越多的处理器集成了SIMD扩展,但是非连续或者非对齐访存会阻碍程序的向量化或者造成性能损失。本文针对实际应用中出现的数组引用不连续的情况,提出了一种数学模型刻画数组的访存模式和数据重组方案,以判断这些数组引用是否可以通过数组转置的方法满足连续性要求;并采用过程间数组填充,循环剥离和基于SLP的向量化代码生成方法等进行对齐优化。最后基于SPEC2000测试集对该算法进行了测试,实验结果表明该方法可以有效地提升向量化程序的执行效率。
数据重组 多维数组填充 对齐优化 访存模式 单指令流多数据流 向量化程序
魏帅 赵荣彩 姚远 侯永生
解放军信息工程大学信息工程学院 郑州 450002
国内会议
2011年全国高性能计算学术年会(HPC china2011)
济南
中文
1-7
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)