SIMD技术与向量数学库研究
首先,结合Intel、AMD 和IBM 处理器,介绍了SIMD 向量化技术,以及各自特点.其次,在三种平台上对各自开发的函数库中的部分向量数学函数进行了测试.实验结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell SDK 函数,因其独特的体系结构,多个向量处理单元带来的平均加速比为10.最后,通过对测试结果对比,发现不同数学库中的向量函数之间的性能方面也存在着差异,并对差异原因进行了分析.得出影响性能差异主要是处理器架构,向量计算计算单元个数和访存等因素造成的.
向量化 SSE MMX 3DNow SIMD
解庆春 张云泉 王可 李炎
中国科学院软件研究所并行软件与计算科学实验室, 北京 100190 中国科学院软件研究所并行软件与计算科学实验室, 北京 100190;中国科学院计算机科学国家重点实验室, 北京 100190 中国科学院软件研究所并行软件与计算科学实验室, 北京 100190;中国科学院计算机科学国家重点实验室, 北京 100190;中国科学院研究生院, 北京 100049
国内会议
2010年全国高性能计算学术年会(HPC china2010)
北京
中文
17-23
2010-10-27(万方平台首次上网日期,不代表论文的发表时间)