EDSR vs SRResNet 超分对比：3 项关键改进如何将 PSNR 提升至 34dB

2026/7/5 22:00:50

EDSR vs SRResNet：三项关键改进如何实现34dB超分性能突破

当我们在手机相册中放大一张老照片时，那些模糊的像素块总是令人沮丧。图像超分辨率技术正是为解决这一痛点而生——它能让模糊的图像重获新生。在众多超分算法中，EDSR（Enhanced Deep Super-Resolution Network）以其卓越的性能脱颖而出，其PSNR值可达惊人的34dB。但EDSR并非凭空而来，它建立在SRResNet的基础之上，通过三项关键改进实现了质的飞跃。

1. 移除BN层：释放模型潜力的关键决策

Batch Normalization（BN）曾是深度学习领域的"标配"，它能加速训练、防止梯度消失，在分类任务中表现优异。但在超分辨率任务中，BN却成了性能的桎梏。

为什么BN不适合超分任务？

对比度破坏：BN会对特征进行归一化，改变图像的绝对亮度值。而超分任务要求输出与输入在色彩分布上保持一致，仅增强细节。
内存消耗：BN层占用与卷积层相当的内存，移除后可节省约40%显存，使模型能使用更多通道或更深结构。
训练不稳定：实验表明，带BN的超分网络常出现训练震荡甚至发散的情况。

有趣的是，SRResNet中保留了BN层，因为其残差连接（skip connection）可以绕过BN传递原始对比度信息。但EDSR证明，完全移除BN能获得更好效果。

移除BN的实际收益：

训练速度提升约2倍
最大支持256个特征通道（SRResNet仅64个）
PSNR提升0.5-1dB

2. L1损失函数：告别模糊图像的明智选择

损失函数决定了模型优化的方向。SRResNet使用L2损失（均方误差），而EDSR转向了L1损失（平均绝对误差），这一改变带来了显著提升。

L1 vs L2的数学本质：

特性	L1损失	L2损失
公式	$\|y-\hat{y}\|$	$(y-\hat{y})^2$
对异常值	鲁棒	敏感
最优解	中位数	均值
梯度	恒定	随误差线性增长

为什么L1更适合超分？

自然图像具有多模态分布特性——图像细节可能对应多个合理的HR版本。L2损失会迫使网络输出所有可能结果的"平均值"，导致细节模糊；而L1损失鼓励网络选择最可能的模式，保留清晰边缘。

实验数据表明，在DIV2K数据集上：

相同结构下，L1比L2训练出的模型PSNR高0.3dB
纹理区域SSIM提升更明显，达2-5%

# Pytorch中两种损失的实现对比 l1_loss = torch.nn.L1Loss()(sr_image, hr_image) l2_loss = torch.nn.MSELoss()(sr_image, hr_image)

3. 残差缩放：稳定深层训练的秘诀

当我们将EDSR扩展到256通道、32个残差块时，训练变得极不稳定。残差缩放（Residual Scaling）的引入巧妙地解决了这一问题。

技术原理：

在残差路径末端添加缩放层（系数通常取0.1）
将残差输出乘以缩放因子后再与主路径相加
数学表达：$output = main + 0.1 \times residual$

这项改进带来三重好处：

稳定训练：抑制了深层网络的梯度爆炸
性能提升：允许使用更大模型，PSNR再获0.2dB提升
推理效率：缩放层可合并到前驱卷积中，不增加计算量

实际训练曲线显示，添加残差缩放后：

训练初期损失下降快30%
最终收敛更平稳
不同学习率下的鲁棒性增强

4. 综合效果：从理论到实践的跨越

将三项改进组合后，EDSR在多个基准测试集上创造了新的记录：

Set5数据集上的表现（×4超分）：

模型	PSNR(dB)	SSIM	参数量
SRResNet	32.05	0.891	1.5M
EDSR	34.17	0.921	43M
EDSR+	34.45	0.925	43M

注：EDSR+表示使用自集成（self-ensemble）测试策略

实际应用中的技巧：

渐进式训练：先训练×2模型，再以其初始化×4模型
数据增强：使用8种几何变换（旋转+翻转）生成多样本
学习率策略：采用分段常数衰减（5000步后从1e-4降至5e-5）

# 渐进式训练示例（PyTorch） model_x2 = EDSR(scale=2).train() train(model_x2, epochs=100) model_x4 = EDSR(scale=4) model_x4.load_state_dict(model_x2.state_dict(), strict=False) # 参数迁移 train(model_x4, epochs=200)

在NTIRE2017超分挑战赛中，EDSR以显著优势夺冠，其重建图像在放大4倍后仍能保持锐利的边缘和丰富的纹理。这不仅是算法设计的胜利，更是对超分任务本质深刻理解的体现——有时，做减法（如移除BN）比做加法更需要洞察力。