会议专题

基于Matrix的矩阵-向量乘法向量化的优化设计与实现

线性代数算法子程序(BLAS)广泛应用于科学计算,以及工程计算.针对Matrix体系结构的特点,对矩阵-向量乘法向量化算法,进行数据布局和体系结构映射设计,采用手工汇编指令重排、软件流水、循环展开等优化方法进行优化设计与实现.实验结果表明,矩阵-向量乘法向量化算法在Matrix上的计算平均效率达到90%以上.

向量处理器 矩阵-向量乘法向量化算法 优化设计 数据布局 结构映射

唐国粟 刘仲

国防科技大学计算机学院 长沙410073

国内会议

第十七届计算机工程与工艺年会暨第三届微处理器技术论坛

西宁

中文

99-103

2013-07-20(万方平台首次上网日期,不代表论文的发表时间)