会议专题

融合注意力机制的模糊图像多尺度复原

  目的 去模糊任务通常难以进行对图像纹理细节的学习,所复原图像的细节信息不丰富,图像边缘不够清晰,并且需要耗费大量时间.本文通过对图像去模糊方法进行分析,同时结合深度学习和对抗学习的方法,提出一种新型的基于生成对抗网络(generative adversarial network,GAN)的模糊图像多尺度复原方法.方法 使用多尺度级联网络结构,采用由粗到细的策略对模糊图像进行复原,增强去模糊图像的纹理细节;同时采用改进的残差卷积结构,在不增加计算量的同时,加入并行空洞卷积模块,增加了感受野,获得更大范围的特征信息;并且加入通道注意力模块,通过对通道之间的相关性进行建模,加强有效特征权重,并抑制无效特征;在损失函数方面,结合感知损失(perceptual loss)以及最小均方差(mean squared error,MSE)损失,保证生成图像和清晰图像内容一致性.结果 通过全参考图像质量评价指标峰值信噪比(peak signal to noise ratio,PSNR)、结构相似性(structural similarity,SSIM)以及复原时间来评价算法优劣.与其他方法的对比结果表明,本文方法生成的去模糊图像PSNR 指标提升至少3.8%,复原图像的边缘也更加清晰.将去模糊后的图像应用于YOLO-v4(you only look once)目标检测网络,发现去模糊后的图像可以检测到更小的物体,识别物体的数量有所增加,所识别物体的置信度也有一定的提升.结论 采用由粗到细的策略对模糊图像进行复原,在残差网络中注入通道注意力模块以及并行空洞卷积模块改进网络的性能,并进一步简化网络结构,有效提升了复原速度.同时,复原图像有着更清晰的边缘和更丰富的细节信息.

注意力机制 图像修复 深度学习 生成对抗网络(GAN) 多尺度

陈紫柠 张宏怡 曾念寅 李寒

厦门理工学院光电与通信工程学院,厦门 361024 厦门大学航天航空学院,厦门 361102

国内会议

2022低质图像增强前沿论坛

线上

中文

1682-1696

2022-04-21(万方平台首次上网日期,不代表论文的发表时间)