基于FPGA的细粒度并行K-means算法加速器的设计与实现
本文在深入分析K-means算法计算特征的基础上,基于FPGA平台提出并实现了一种细粒度的并行浮点K-means算法。设计采用了阵列多PE并行处理的任务划分策略,实现了处理单元间的负载平衡,采用数据驱动的流水线隐藏片外存储访问,设计了一种基于脉动阵列结构的主从多PE并行计算阵列,并在单片FPGA(XC5VLX330)上成功集成了4个PE。实验结果表明,提出的K-means算法加速器结构具备良好的可扩展性。通过实验测试,我们的实现方案相对于Pentium 4 2.66 GHz单处理器程序达到了15倍的加速比。
K-meanS算法 FPGA平台 硬件加速器 浮点实现 细粒度 可扩展性
倪时策 窦勇 雷元武 赵建勋
国防科技大学计算机学院,湖南 长沙 410073 装甲兵工程学院,北京 100072
国内会议
长沙
中文
64-67
2009-10-23(万方平台首次上网日期,不代表论文的发表时间)