会议专题

ARM嵌入式系统的DNN性能优化

从AI+计算、深度学习、Perf CV、Open BLAS等方面介绍了ARM嵌入式系统的DNN性能优化。提出基于矩阵,BLAS的DNN性能优化;Open BLAS是最好的开源BLAS实现;AUGEM可以自动生成高效汇编;采用Perf DNN(Perf SGEMM),ARMv7,可以提高1倍以上。

ARM嵌入式系统 深层神经网络 深度学习

张先轶

PerfXLab澎峰科技

国内会议

BDTC2016中国大数据技术大会

北京

中文

1-38

2016-12-08(万方平台首次上网日期,不代表论文的发表时间)