Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪

904次阅读

Machine Intelligence Research

近年来，利用深度神经网络解决图像去噪问题的热潮方兴未艾，但现有方法大多依赖于简单的噪声假设，如加性高斯白噪声(AWGN)、JPEG压缩噪声和相机传感器噪声等，而针对真实图像的通用盲去噪方法仍未出现。苏黎世联邦理工学院Luc Van Gool教授团队试图从网络架构设计和训练数据合成的角度来解决这一问题。具体而言，在网络架构设计方面，本文设计了一个swin-conv模块，将残差卷积层的局部建模能力和swin transformer模块的非局部建模能力结合起来，并将其作为主要构建模块插入到广泛使用的图像到图像转换模型:UNet架构中。在训练数据合成方面，本文设计了一个实用的噪声退化模型，该模型考虑了不同类型的噪声(包括高斯噪声、泊松噪声、斑点噪声、JPEG压缩噪声和处理后的相机传感器噪声)和大小调整，还涉及随机洗牌策略和双重退化策略。在去除AGWN和真实图像去噪方面的大量实验表明，新的网络架构设计实现了最先进的性能，新的退化模型则有助于显著提高实用性。该研究希望能够为当前的去噪研究提供有用的见解。源代码见：https://github.com/cszn/SCUNet，在线去噪网址见：https://replicate.com/cszn/scunet。

Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪

图片来自Springer

全文下载：

Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis

https://link.springer.com/article/10.1007/s11633-023-1466-0

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1466-0

全文导读

图像去噪，即从噪声观测中恢复潜在的干净图像的过程，或许是最基础的图像复原问题。原因至少有三个方面。首先，图像去噪有助于评估不同图像先验和优化算法的有效性。其次，图像去噪可以插入变量分裂算法(如半二次分裂法和交替方向乘子法)以解决其他问题(如去模糊和超分辨率)。第三，图像去噪可能包含在其他视觉任务的预处理过程中。

近年来，深度神经网络已成为图像去噪的主流方法。为了提高深度图像去噪性能，研究人员主要关注两个研究方向。第一个方向是提高加性高斯白噪声(AWGN)假设下的性能。第二个方向主要侧重于训练数据或噪声建模。这两个方向都有助于实现真实图像去噪的终极目标。

图像去噪的退化模型可以用数学公式表示为

y = x + n

其中，n是要去除的噪声。n的常见假设有AWGN、JPEG压缩噪声、泊松噪声和相机传感器噪声，其中AWGN因其数学上的便利性而被广泛使用。然而，众所周知，由于噪声假设不匹配，由 AWGN 训练的深度图像去噪模型在大多数真实图像中都表现不佳。不过，AWGN去噪在测试不同网络架构设计的有效性方面表现良好。近年来，人们提出了各种网络架构设计。其中具有代表性的有 DnCNN、N3Net、NLRN、DRUNet和SwinIR。实际上，网络架构设计有助于捕捉图像先验信息，从而提高图像去噪性能。例如，N3Net和NLRN专用来捕捉非本地图像先验。虽然在基准数据集上的PSNR性能已经有了很大提高，例如，在噪声水平为25的Set12数据集上，SwinIR 的PSNR平均值比DnCNN高出了0.57dB，那么一个有趣的问题是：是否可以通过先进的网络架构设计来进一步提高PSNR性能？

为了提高深度去噪模型的实用性，研究者把大量精力投入到了噪声建模。其动机是让噪声假设与真实图像的退化情况相一致。Plötz和Roth利用消费级相机建立了一个真实的噪声数据集(DND)，该数据集由RAW域和sRGB域中不同的真实噪声和几乎无噪声参考图像对组成。他们进一步表明，在sRGB DND数据集上，经过精确去噪重新训练的模型明显优于经过AWGN训练的模型。Brooks等人利用数字传感器的物理特性和数字信号成像流程的步骤，设计了一种相机传感器噪声合成方法，并提供了一种有效的深度RAW域图像去噪模型。虽然上述尝试都强调了退化模型的重要性，但它们主要关注的是相机传感器噪声相关的去噪。然而，关于如何训练图像盲去噪的深度模型的研究还很少。那么,如何改善盲去噪的训练数据是第二个有趣的问题。

本文尝试通过新的网络架构设计和新的训练数据合成来回答上述两个问题。在网络架构设计方面，本文考虑到：1)不同的图像去噪方法具有互补的图像先验建模能力，可以结合使用以提高性能；2)DRUNet和SwinIR采用了截然不同的网络架构设计，但却取得了非常好的去噪性能，因此本文推出了一个Swin-conv 模块，将残差卷积层的局部建模能力和Swin转换器模块的非局部建模能力结合起来，并将其作为主要构建模块插入UNet 架构。为了测试其有效性，本文在AWGN去噪的基准数据集上评估了其PNSR性能。由于真实图像噪声可能由其他类型的噪声引入，如JPEG压缩噪声、处理后的相机传感器噪声，并且会受到大小调整的进一步影响，因此用参数概率分布建模过于复杂。为解决这个问题，本文提出了一种不同类型噪声(包括高斯噪声、泊松噪声、斑点噪声、JPEG压缩噪声和经过处理的相机传感器噪声)和大小调整操作(包括常用的双线性插值和双三次插值)的随机洗牌方法，以粗略逼近真实图像噪声。

Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪本文所提Swin-Conv-UNet (SCUNet)去噪模型的框架图

本文的贡献如下：

1) 提出了一种新的去噪网络，将新的swin-conv块插入多尺度UNet，以提高局部和非局部建模能力。

2) 提出了一种手工设计的噪声合成模型，可用于训练通用的图像盲去噪模型。

3) 用提出的噪声合成模型训练的盲去噪模型可以显著提高真实图像的实用性。

4) 为合成高斯去噪和实际图像盲去噪提供了强有力的基准。

效果示例

Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪真实噪声图像

Luc Van Gool团队 | 通过Swin-Conv-UNet和数据合成实现实用图像盲去噪去噪结果

全文下载：

Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis

https://link.springer.com/article/10.1007/s11633-023-1466-0

https://www.mi-research.net/en/article/doi/10.1007/s11633-023-1466-0

BibTex:

@Article{MIR-2022-11-351,
author = {Kai Zhang and Yawei Li and Jingyun Liang and Jiezhang Cao and Yulun Zhang and Hao Tang and Deng-Ping Fan and Radu Timofte and Luc Van Gool},
journal = {Machine Intelligence Research},
title = {Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis},
year = {2023},
volume = {20},
number = {6},
pages = {822-836},
doi = {10.1007/s11633-023-1466-0}
}

纸刊免费寄送

Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务，如您对本篇文章感兴趣，请点击下方链接填写收件地址，编辑部将尽快为您免费寄送纸版全文！

说明：如遇特殊原因无法寄达的，将推迟邮寄时间，咨询电话010-82544737

收件信息登记：

https://www.wjx.cn‍/vm/eIyIAAI.aspx#

∨

关于Machine Intelligence Research

Machine Intelligence Research（简称MIR，原刊名International Journal of Automation and Computing）由中国科学院自动化研究所主办，于2022年正式出版。MIR立足国内、面向全球，着眼于服务国家战略需求，刊发机器智能领域最新原创研究性论文、综述、评论等，全面报道国际机器智能领域的基础理论和前沿创新研究成果，促进国际学术交流与学科发展，服务国家人工智能科技进步。期刊入选”中国科技期刊卓越行动计划”，已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等数据库收录。

▼
往期目录
▼