会议专题

TRIPS上的矩阵乘法性能分析

  以TRIPS为代表的分片式结构是未来通用微处理器设计的可选方案之一.TRIPS采用细粒度推测多线程的方法,极大地开发了程序运行时的片内并行性,力图为各种类型的应用提供一个统一高效的实现平台.但运行稠密数值运算时,由于数据存放位置与指令调度的不合理,TRIPS不能发挥其结构优势.本文在一个经过时钟精确性验证的TRIPS模拟器上运行小规模稠密矩阵乘法,通过调整模拟器的各种结构参数获得不同配置下的程序性能,并通过对这些实验结果的分析,得到了TRIPS执行此类应用遇到的性能瓶颈.同时,本文针对这些瓶颈提出了调整TRIPS的存储模型和改进指令调度器等优化方法,以提高运行稠密数值运算的程序性能.

TRIPS模拟器,矩阵乘法 数值运算 系统结构 存储模型 程序性能

毛梦捷 安虹 刘扬 孙涛

中国科学技术大学计算机科学与技术学院 合肥,230027

国内会议

2010年全国高性能计算学术年会(HPC china2010)

北京

中文

373-379

2010-10-27(万方平台首次上网日期,不代表论文的发表时间)