欢迎光临散文网 会员登陆 & 注册

【AI绘画】Stable Diffusion超分放大:高清修复(Hires.Fix)篇

2023-06-21 18:14 作者:whyOrange歪橘  | 我要投稿

以下图片均为 https://www.bilibili.com/video/BV1ro4y1P7yV/ 视频中测试生成的图像。

由于专栏对上传图像大小的限制,无法上传大小超过 20MB 的 PNG 原图,所以我只能将 PNG 转成 JPG再上传。

Latent(两次线性)(2x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:1024 x 1664

单张图耗时:约 20s

Latent(两次线性)(2x放大)

可以看到,Latent 放大算法在低重绘幅度下,生成的图像是模糊的。

在该例子中:

0.3的图像开始可用,前提是你喜欢这种朦胧感。

0.4~0.6的图像的超分放大效果较好。

    0.4的图像,背景仍然存在模糊感

    0.6的图像,背景开始发生变化(左侧的树枝变成一堆绿叶)。

从0.7开始,画面内容出现较大变化。

    0.7的图像背景与前面的图像相比发生了较大的变化。另外,右侧底部的手也出现了问题。    

    0.8的的图像不仅背景有较大变化,人物的服装也发生较大变化。

    0.9和1.0的图像,直接古神化。

Latent(两次线性)(4x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:2048 x 3328

单张图耗时:约 4min

Latent(两次线性)(4x放大)

可以看到,4x放大的效果无论在那个重绘幅度下都挺差的。

在该例子中:

0.4之前的图像都是模糊的。

0.5~0.6的图像虽然不模糊,但画面是扭曲的。

    0.4的图像,背景仍然存在模糊感。

    0.6的图像,背景开始发生变化(左侧的树枝变成一堆绿叶)。

从0.7开始,画面直接放飞自我,直通古神。

R-ESRGAN 4x+ (2x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:1024 x 1664

单张图耗时:约 20s

R-ESRGAN 4x+ (2x放大)

在该例子中:

0~0.5的图像都比较正常。

    当重绘幅度为0时,相当于用后期处理直接进行超分放大。

从0.6开始,画面内容出现变化。

    0.6和0.7的图像,背景发生变化。

    0.8的图像,背景和人物服装都发生了变化。

0.9和1.0的图像,直接古神化。

R-ESRGAN 4x+ (4x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:2048 x 3328

单张图耗时:约 4min

R-ESRGAN 4x+ (4x放大)

与 Latent 放大算法的情况不同,R-ESRGAN 4x+ 放大算法在低重绘幅度下的图还是可以用的。

在该例子中:

0~0.3的图像效果还是可以接受的。

    当重绘幅度为0时,相当于用后期处理直接进行超分放大。

从0.4的图像开始,画面背景逐渐变模糊。

    0.6的图像,右侧底部的手出现了问题。

    0.7的图像,手臂直接变成了头发。

从0.8的图像开始,画面逐渐古神化。

Latent(nearest)与 Latent(nearest-exact)

2x放大

原图尺寸:512 x 832

超分放大后尺寸:1024 x 1664

Latent(nearest)& Latent(nearest-exact) 2x放大

当放大倍数为整数倍时,两个 Latent 放大算法的区别不大。

1.5x放大

原图尺寸:512 x 832

超分放大后尺寸:768 x 1248

Latent(nearest)& Latent(nearest-exact) 1.5x放大

当放大倍数不是整数时,两个 Latent 放大算法的区别就展现出来了。

可对比两张图像的以下部分:

头顶的蝴蝶结、刘海、眼睛、耳环、脖子上的饰品、裙子的装饰以及裙摆的装饰等。

另外,用 Latent(nearest)放大算法生成的图像,女孩的左肩位置存在类似头发的伪影。

【AI绘画】Stable Diffusion超分放大:高清修复(Hires.Fix)篇的评论 (共 条)

分享到微博请遵守国家法律