一种支持阻塞分段传输的DMA部件的设计与实现
针对通用矩阵乘(GEneralized matrix multiplication,GEMM)核心算法,提出了一种支持阻塞分段传输的直接存储访问控制器(direct memory access,DMA)结构.当有多个核进行核内到核外的数据传输时,阻塞分段传输机制可以替代软件锁同步的方式自动检测这些事务的状态,并在所有事务结束后启动分段传输事务.在NC-VERILOG仿真平台上的仿真结果表明,与软件锁同步方式相比,阻塞分段传输结构有2方面的优势:1)对单纯的数据传输,使用阻塞分段传输结构启动分段传输可以至少提前50拍;2)对GEMM核心算法,使用阻塞分段传输结构比使用软件锁同步的运行时间减少10000拍以上.
直接存储访问控制器 结构设计 阻塞分段传输 通用矩阵乘
王占立 马胜 许邦建 杨柳
国防科学技术大学计算机学院 长沙 410073
国内会议
北京
中文
117-122
2014-09-11(万方平台首次上网日期,不代表论文的发表时间)