适用于矩阵运算的基于流媒体指令的数据预取
本文针对X86的SSE结构,提出了一种流媒体结构中的Cache预取方法,它把对Cache的利用与应用该Cache的指令结构结合起来,属于定长步长的预取技术。对矩阵运算这样规律性很强的应用,提出了二次步长的概念。并利用二次步长,将利用单步长的不命中数进一步降低。利用包括SSE指令的X86体系结构的模拟器,把所提出的模型与公认的几种预取模型作了比较,给出了在矩阵运算中的比较结果,比其他同类型预取技术提高20%。
数据预取 流媒体指令 矩阵运算
葛仁北
中科院计算所微处理器中心,北京,100080
国内会议
成都
中文
138-141,172
2006-08-17(万方平台首次上网日期,不代表论文的发表时间)