基于Matrix的矩阵-向量乘法向量化的优化设计与实现
线性代数算法子程序(BLAS)广泛应用于科学计算,以及工程计算.针对Matrix体系结构的特点,对矩阵-向量乘法向量化算法,进行数据布局和体系结构映射设计,采用手工汇编指令重排、软件流水、循环展开等优化方法进行优化设计与实现.实验结果表明,矩阵-向量乘法向量化算法在Matrix上的计算平均效率达到90%以上.
向量处理器 矩阵-向量乘法向量化算法 优化设计 数据布局 结构映射
唐国粟 刘仲
国防科技大学计算机学院 长沙410073
国内会议
西宁
中文
99-103
2013-07-20(万方平台首次上网日期,不代表论文的发表时间)