会议专题

基于FPGA的宽度优先搜索硬件加速方法研究

随着社交网络、图像处理、人工智能的不断发展,对其等效图进行快速分析变得越来越重要.宽度优先搜索(BFS)是许多图算法的基础.但由于算法的访存不规则性,在基于局部性原理设计的计算机体系结构上,访存延迟、cache一致性原理以及内部同步机制等问题都制约了算法性能的提升.实现了一种基于FPGA平台的多软核消息传递的体系结构.通过使用访存队列、细粒度并行等多种优化方法,在Virtex-5VLX330FPGA平台上取得了500MTEPS以上的性能并且具有良好的可扩展性.

图像处理 宽度优先搜索 现场可编程门阵列 消息传递 可扩展性

王强 邹丹 郭松 姜晶菲

国防科技大学并行与分布处理重点实验室 长沙410073

国内会议

第十七届计算机工程与工艺年会暨第三届微处理器技术论坛

西宁

中文

402-408

2013-07-20(万方平台首次上网日期,不代表论文的发表时间)