基于SoC FPGA的统一虚拟内存支持
对于计算密集型任务,基于SoC FPGA的硬件加速器和CPU的协同工作在性能和能效上提供了显著的优势.但是,目前操作系统对各种不同功能的加速器提供的支持很少:操作系统对CPU和加速器在内存上共享的数据没有提供有效管理,如零拷贝、数据一致性等;当前的操作系统也很难为加速器分配大片连续的物理内存空间.本文中,选择Xilinx Zynq平台为研究目标,利用其高性能接口,定性地分析了数据共享的方法;同时,还为FPGA加速器设计了一个新的内存管理系统,它为CPU和加速器提供了一个统一的虚拟内存空间,使得他们能够在操作系统的用户空间访问到相同的内存空间,实现了数据共享和大片连续物理空间的分配.对于深度卷积神经网络典型应用Caffe的核心部分,相对于传统的通用处理器与加速器的协同方法,设计平均可以获得3.21倍的加速比.
虚拟内存 卷积神经网络 处理器 加速器
肖涛 沈俊忠 乔寓然 杨乾明 文梅 罗莉
湖南省长沙市国防科学技术大学计算机学院 410073
国内会议
哈尔滨
中文
256-264
2015-08-06(万方平台首次上网日期,不代表论文的发表时间)