会议专题

基于LLVM实现尾循环向量化

SIMD体系结构呈现向量长度越来越长的发展趋势,允许同时以向量方式处理更多的数据;但是,循环向量化会产生更多的循环尾部指令无法向量化.为了更有效地利用SIMD,本文提出了尾循环向量化方法,通过掩码存取访问内存数据和向量填充方法,基于LLVM实现尾循环的向量化.实验结果表明方法有效,对TSVC测试程序最高可获得1.85倍加速效果,对SPEC2006应用最高达到1.05倍加速.

处理器 单指令多数据 尾循环向量化 底层虚拟机

黄亚斌 李春江 冯璐霞

湖南省长沙市国防科学技术大学计算机学院 410073

国内会议

第二十届计算机工程与工艺年会暨第六届微处理器技术论坛

西安

中文

123-129

2016-08-10(万方平台首次上网日期,不代表论文的发表时间)