深度学习硬件方案综述
深度学习技术促进了人工智能的迅速发展,被广泛应用于各个领域.但深度神经网络模型规模庞大、结构复杂,对其进行优化需要耗费巨大的计算资源.随着计算机硬件的快速发展,各种加速器的处理能力显著增强,为深度学习提供了硬件基础.本文首先介绍深度学习背景及其对硬件的需求;然后对当前主要的硬件加速器进行对比分析;此外,GPU较为适合SIMD体系结构,它只需一个指令就能并行处理大量数据。但是对于需要用多条指令平行处理一个数据的MISD,FPGA更有优势,且更适合深度学习加速:首先,FPGA可以方便灵活地调整电路配置来适应算法;其次,FPGA比GPU更适合用于深度学习的推断阶段;最后,赛灵思研发了可重配置加速栈堆,以降低FPGA的编程难度,提供了一些硬件加速方案,用户可直接挑选方案,不用自己设计布局布线,方便快捷。未来,FPGA将会更有效地适应深度学习技术研究。
深度学习 人工智能 硬件加速器 现场可编程逻辑门阵列
沈阳 王倩 王亚男 王磊
国家新闻出版广电总局广播科学研究院 北京工商大学
国内会议
杭州
中文
64-68
2017-11-15(万方平台首次上网日期,不代表论文的发表时间)