基于局部性分析数据预取在GCC上的实现
微处理器与DRAM之间速度差异越来越大,系统优化需要更多积极有效的方法来减少或隐藏访存延迟.数据预取是隐藏访存延迟的一种有效方法,本文在GCC编译器上实现了一种基于精确局部性分析的数据预取优化算法.对spec2000和NPB2.3的测试结果显示,实施了该优化的GCC平均性能比原来提高了9%.
GCC 数据预取 重用性 局部性 局部迭代空间
郭勇 尉红梅 漆锋滨
江南计算技术研究所,江苏,无锡,214083
国内会议
长沙
中文
21-23,44
2006-11-01(万方平台首次上网日期,不代表论文的发表时间)