会议专题

适用于矩阵运算的基于流媒体指令的数据预取

本文针对X86的SSE结构,提出了一种流媒体结构中的Cache预取方法,它把对Cache的利用与应用该Cache的指令结构结合起来,属于定长步长的预取技术。对矩阵运算这样规律性很强的应用,提出了二次步长的概念。并利用二次步长,将利用单步长的不命中数进一步降低。利用包括SSE指令的X86体系结构的模拟器,把所提出的模型与公认的几种预取模型作了比较,给出了在矩阵运算中的比较结果,比其他同类型预取技术提高20%。

数据预取 流媒体指令 矩阵运算

葛仁北

中科院计算所微处理器中心,北京,100080

国内会议

2006中国计算机学会体系结构专委会学术年会

成都

中文

138-141,172

2006-08-17(万方平台首次上网日期,不代表论文的发表时间)