【AI绘画】Stable Diffusion超分放大:高清修复(Hires.Fix)篇
以下图片均为 https://www.bilibili.com/video/BV1ro4y1P7yV/ 视频中测试生成的图像。
由于专栏对上传图像大小的限制,无法上传大小超过 20MB 的 PNG 原图,所以我只能将 PNG 转成 JPG再上传。
Latent(两次线性)(2x放大)
跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)
原图尺寸:512 x 832
超分放大后尺寸:1024 x 1664
单张图耗时:约 20s

可以看到,Latent 放大算法在低重绘幅度下,生成的图像是模糊的。
在该例子中:
0.3的图像开始可用,前提是你喜欢这种朦胧感。
0.4~0.6的图像的超分放大效果较好。
0.4的图像,背景仍然存在模糊感
0.6的图像,背景开始发生变化(左侧的树枝变成一堆绿叶)。
从0.7开始,画面内容出现较大变化。
0.7的图像背景与前面的图像相比发生了较大的变化。另外,右侧底部的手也出现了问题。
0.8的的图像不仅背景有较大变化,人物的服装也发生较大变化。
0.9和1.0的图像,直接古神化。
Latent(两次线性)(4x放大)
跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)
原图尺寸:512 x 832
超分放大后尺寸:2048 x 3328
单张图耗时:约 4min

可以看到,4x放大的效果无论在那个重绘幅度下都挺差的。
在该例子中:
0.4之前的图像都是模糊的。
0.5~0.6的图像虽然不模糊,但画面是扭曲的。
0.4的图像,背景仍然存在模糊感。
0.6的图像,背景开始发生变化(左侧的树枝变成一堆绿叶)。
从0.7开始,画面直接放飞自我,直通古神。
R-ESRGAN 4x+ (2x放大)
跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)
原图尺寸:512 x 832
超分放大后尺寸:1024 x 1664
单张图耗时:约 20s

在该例子中:
0~0.5的图像都比较正常。
当重绘幅度为0时,相当于用后期处理直接进行超分放大。
从0.6开始,画面内容出现变化。
0.6和0.7的图像,背景发生变化。
0.8的图像,背景和人物服装都发生了变化。
0.9和1.0的图像,直接古神化。
R-ESRGAN 4x+ (4x放大)
跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)
原图尺寸:512 x 832
超分放大后尺寸:2048 x 3328
单张图耗时:约 4min

与 Latent 放大算法的情况不同,R-ESRGAN 4x+ 放大算法在低重绘幅度下的图还是可以用的。
在该例子中:
0~0.3的图像效果还是可以接受的。
当重绘幅度为0时,相当于用后期处理直接进行超分放大。
从0.4的图像开始,画面背景逐渐变模糊。
0.6的图像,右侧底部的手出现了问题。
0.7的图像,手臂直接变成了头发。
从0.8的图像开始,画面逐渐古神化。
Latent(nearest)与 Latent(nearest-exact)
2x放大
原图尺寸:512 x 832
超分放大后尺寸:1024 x 1664

当放大倍数为整数倍时,两个 Latent 放大算法的区别不大。
1.5x放大
原图尺寸:512 x 832
超分放大后尺寸:768 x 1248

当放大倍数不是整数时,两个 Latent 放大算法的区别就展现出来了。
可对比两张图像的以下部分:
头顶的蝴蝶结、刘海、眼睛、耳环、脖子上的饰品、裙子的装饰以及裙摆的装饰等。
另外,用 Latent(nearest)放大算法生成的图像,女孩的左肩位置存在类似头发的伪影。