科学计算在流处理器上的实现与优化
当前传统处理器体系结构已难以满足科学计算的需求.流体系结构适合计算密集型应用,其中媒体应用的适用性已得到验证,而科学计算的适用性仍在探索中.由于流处理器将体系结构细节暴露给程序员,而且相较于媒体程序,科学应用的数据访问方式和数据间依赖关系更为复杂,所以优化更为直接影响着科学应用流程序的性能. 本文以流体力学应用QNJ-5、光学应用LADT和Navier-Stokes方程为例进行流化,给出我们的流化方法,并在Isim流模拟器上进行性能模拟,与高性能x86处理器相比,获得了较高加速比,验证了科学计算类应用在流体系结构上的适用性;结合核心合并及核级优化,以QNJ-5的执行热点QMRCGSTAB的流程序为例,进行优化并分析结果,相较于未优化的流程序,优化可以获得更大的性能增益.
科学计算 流处理器 流编程模型 核心合并 核级优化
杨学军 张英 李根 窦强 庞征斌 张俊
国防科技大学计算机学院,湖南 长沙 410073
国内会议
2008年中国计算机学会体系结构专委会学术年会(ACA”08)
南京
中文
194-198
2008-11-05(万方平台首次上网日期,不代表论文的发表时间)