ARM嵌入式系统的DNN性能优化
从AI+计算、深度学习、Perf CV、Open BLAS等方面介绍了ARM嵌入式系统的DNN性能优化。提出基于矩阵,BLAS的DNN性能优化;Open BLAS是最好的开源BLAS实现;AUGEM可以自动生成高效汇编;采用Perf DNN(Perf SGEMM),ARMv7,可以提高1倍以上。
ARM嵌入式系统 深层神经网络 深度学习
张先轶
PerfXLab澎峰科技
国内会议
北京
中文
1-38
2016-12-08(万方平台首次上网日期,不代表论文的发表时间)