GPU集群加速CT图像重建
CT图像重建具有高计算密集性、高并行性、大数据量的特点,特别适用于单指令多线程并行操作的流处理架构,图形处理单元正是基于这样架构的一种硬件。本文基于消息传递接口与CUDA混合编程,实现了多个图形处理单元计算结点组成的集群对CT图像重建的滤波反投影算法的加速。实验结果表明,重建图像尺寸越大,图形处理单元/CPU加速比越高;且随着结点数的增多,图形处理单元设备初始化的时间逐渐成为重建速度的瓶颈。
图像重建 消息传递接口 滤波反投影算法 图形处理
孟凡勇 王维
中国科学院过程工程研究所多相复杂系统国家重点实验室,北京 100190 中国科学院研究生院,北京 100049 中国科学院过程工程研究所多相复杂系统国家重点实验室,北京 100190
国内会议
上海
中文
123-130
2009-07-01(万方平台首次上网日期,不代表论文的发表时间)