面向龙芯处理器SIMD扩展的编译器内在函数优化
通用微处理器中的单指令多数据(SIMD)指令扩展因能有效提升并行处理能力而一直受到处理器生产厂商的亲睐,龙芯处理器也增加了这种SIMD扩展。如何为程序员提供高效、好用的SIMD编程接口,是工业界和学界研究的热点问题。我们在龙芯编译器中实现了针对该扩展的内在函数支持,为程序员提供灵活、方便的SIMD编程接口。为了提升接口支持的效率,我们利用龙芯编译器和龙芯处理器的特性进行编译优化。并利用有龙芯SIMD指令嵌入式汇编优化的Mplayer视频解码器作为基准,将其采用一一对应的方式改写为内在函数实现,性能测试结果显示内在函数实现的解码器性能比嵌入式汇编形式还要好2%。实验证明,我们在龙芯编译器中实现的内在函数支持,在方便程序员编程的同时,也能利用编译器已有的编译优化。
龙芯处理器 单指令多数据 内在函数支持 编译器优化 指令扩展
凌坤 胡士文 连瑞琦
中国科学院计算技术研究所 系统结构重点实验室 北京 100190
国内会议
2011年全国高性能计算学术年会(HPC china2011)
济南
中文
1-6
2011-10-26(万方平台首次上网日期,不代表论文的发表时间)